语言中银行:海基Rasilo

11.3.2021
Kielipankki——芬兰语言银行是服务人员使用语言资源。海基Rasilo告诉我们关于他的阿尔托大学DSP课程对话语料库的研究生产相关的演讲。

你是谁?

我是海基Rasilo,博士后研究员人工智能实验室sccp在布鲁塞尔,比利时。我有博士学位之间的联合学位VUB和阿尔托大学在2017年。在私营部门工作的几年中,我收到了一个研究拨款乌拉Tuominen基金会,通过芬兰基础的博士后池继续我的研究。

你的研究课题是什么?

我的博士研究已经从一开始,我的主要研究重点是身体语言产生和学习机制。人类的孩子学会如何表达和模仿父母的演讲,用自己的声音的不同大小和形状?成人和婴儿的声学性质的演讲也不同,,很难直接进行比较。然而,孩子学会表达自己的母语,我感兴趣的发音学习过程是否也能影响我们识别和理解的方式讲话。可能的一个原因我们理解语言比机器是我们知道演讲产生的物理机制。

我目前调查形成语言的声学表现,是否在学习语音清晰度还可以用于自动语音识别。所需的记录语音数据,为了培养世界上最好的语音识别器是巨大的,和人类的孩子们不太可能遇到类似的演讲在语音习得的过程。因此,必须能够学会理解演讲与少量的数据,和物理清晰度可能在学习过程中发挥作用。

你的研究与Kielipankki有关吗?

在去年发表的一项研究中,我训练一个神经网络同时识别音素和物理与语音清晰度。发音学习的假设是将形状表征网络学习,也可以帮助这些新表示当识别音素。的实验中,我需要记录的演讲以及发音相关信息。芬兰银行的语言,我发现阿尔托大学DSP课程对话语料库包含足够多的芬兰语言材料包括语音合成。从音标,我能够生成粗合成发音数据通过使用一个芬兰语音合成器。实验的结果是有前途的演讲——发音学习形状表示的方式可以提高音素识别。

在先前的研究中,我也使用了照顾者语料库(可以通过ELRA),由简单的句子和它们的拼写音标。与学院研究员Okko Rasanen,我们使用语料库来研究某些学习词义映射算法,分词和声学模式相关的单词。

相关的出版物Kielipankki

Rasilo, h (2020)。语音学习基于articulatory-acoustic演讲表示。Teoksessa丹尼森。许,m . Mack, y,公元前&阿姆斯特朗(Eds),《第42认知科学协会的年会(页2203 - 2209)。认知科学学会。

Rasilo, h & Rasanen o . (2017),在线模型元音模仿学习。言语交际,86,1。

Rasanen, o . & Rasilo h (2015),联合模型的分词和意义收购通过cross-situational学习。心理评估,122 (4),792 - 829。

Rasilo, h & Rasanen o . (2015),Weakly-supervised单词学习是提高了一个活跃的在线算法。16学报》国际言语交际协会年会(2015年Interspeech),德累斯顿,德国,页1561 - 1565。

FIN-CLARIN财团由一群芬兰大学CSC -它科学中心和芬兰的语言研究所(Kotus)。FIN-CLARIN帮助芬兰研究人员使用,提炼、保存和共享他们的语言资源。芬兰银行的语言是服务的集合,提供的语言材料和工具研究社区。