关于语言环境如何影响语言行为,阅读26,000本书能告诉研究人员什么?布法罗大学艺术与科学学院交流障碍与科学助理教授布兰登·t·约翰斯(Brendan T. Johns)给出了一些答案,这些答案有助于了解从我们如何使用和处理语言到更好地理解阿尔茨海默病的发展等一系列问题。
但让我们明确一点:约翰并没有读过所有这些书。他是计算认知科学方面的专家,发表了一项计算建模研究,该研究表明,我们与特定学习环境的经历和互动,比如我们阅读的内容的特征,导致了语言行为的差异,而这些差异曾被归因于认知的差异。
约翰斯说:“以前的语言学认为,我们使用语言的能力在很大程度上是本能的,我们的环境经验缺乏充分获得必要技能所需的深度。”“我们今天开发的模型让我们质疑早期的结论。环境似乎确实在塑造行为。”
约翰斯和他的合作者,曼尼托巴大学心理学系教授兰德尔·k·贾米森(Randall K. Jamieson)的研究结果发表在该杂志上行为研究方法。
自然语言处理和计算资源的进步使得像约翰和贾米森这样的研究人员能够研究曾经难以解决的问题。
这些模型被称为分布模型,与人类语言学习过程类似。支持这项研究分析的26000本书来自3000个不同的作者(大约2000个来自美国,大约500个来自英国),他们使用了超过13亿个单词。
乔治·萧伯纳常说,英国和美国是被同一种语言隔开的两个国家。但是语言并不相同,为了建立和代表潜在的文化差异,研究人员考虑了26,000本书中的每本书在时间(作者出生的时间)和地点(书出版的地方)的位置。
有了这些信息,研究人员分析了来自10个不同研究的数据,涉及1000多名参与者,使用多种心理语言学任务。
“这篇论文试图回答的问题是,‘如果我们用英国人可能读过的类似材料训练一个模型,而不是美国人可能读过的材料,他们会变得更像这些人吗?’”约翰斯说。“我们发现,人们所处的环境似乎会影响他们的行为。”
根据约翰斯的说法,这项研究中与文化相关的书籍解释了数据中的大部分差异。
“拥有一个特定文化的语料库是一个巨大的好处,而拥有一个特定时间的语料库则有更大的好处,”约翰斯说。“我们发现语言环境和行为的差异是时间和地点的函数,这就是我们所说的‘选择性阅读假说’。”
使用这些机器学习方法展示了这些环境丰富的信息本质,Johns一直致力于构建机器学习框架来优化教育。这篇最新的论文展示了如何通过一个人的语言行为来估计他们阅读的材料类型。
约翰斯说:“我们想利用人们过去的语言经验,建立一个关于这个人所知道的东西的模型。”“这可以让我们确定哪些信息可以最大限度地发挥一个人的学习潜力。”
但约翰斯也研究临床人群,他对阿尔茨海默病患者的研究让他思考如何应用他的模型来潜在地帮助有患病风险的人。
他说,有些人表现出轻微的记忆丧失,但没有其他认知能力下降的迹象。这些患有轻度认知障碍的患者在任何一年都有10-15%的机会被诊断为阿尔茨海默氏症,而65岁以上的普通人群中这一比例为2%。
他说:“我们发现,随着时间的推移,患上阿尔茨海默氏症的人表现出特定类型的语言丧失和生成,他们似乎失去了单词之间的远距离语义联系,以及低频单词。”“我们能否开发任务和刺激,让这群人更长时间地保持他们的语言能力,或者开发一种更个性化的评估,以了解他们在认知系统中丢失了什么类型的信息?”
“这个研究项目有可能为这些重要问题提供信息。”
期刊引用:
引用此页: