HyperAIHyperAI

Command Palette

Search for a command to run...

土著计算机科学家用AI捍卫濒危语言

迈克尔·跑步狼是一位在人工智能(AI)领域工作的本土计算机科学家,他利用AI和虚拟现实工具来挽救濒临灭绝的本土语言。他在佛罗里达州的软件开发公司SynthBee担任研究员,同时是加拿大蒙特利尔Mila–Quebec人工智能研究所“First Languages AI Reality”(FLAIR)项目的联合创始人。作为拉科塔和切罗基族的后代,跑步狼深知技术如何被用于伤害土著社区,因此他的研究工作始终谨慎从事,旨在保护和维护土著主权。 起因 跑步狼在蒙大拿东南部靠近北方切罗基印第安保护区的一个小型偏远小镇Birney长大。尽管小镇条件艰苦,但他从小就接触到了技术。他的母亲是惠普公司的激光光刻学家,负责设计微芯片。受母亲影响,跑步狼在小学时就学会了编程基础,但当他18岁上大学时,身边人才发现他对计算机科学技术的浓厚兴趣。1999年,他在蒙大拿州立大学博兹曼分校选择了当时刚刚兴起的计算机科学专业。 经过 在研究生阶段,跑步狼开始探索如何使用计算工具和大数据来恢复土著文化。他在2014年夏天前往俄罗斯西伯利亚,收集当地土著人民的故事,并使用自然语言处理技术寻找与自己的文化和语言之间的相似性。这期间,他还遇到了未来的妻子卡洛琳,她是阿帕卢克族的一名成员,能说11种语言,并且正在学习土著美洲历史。“我们都在为土著文化的理解和技术的使用缺乏实质性进展而感到沮丧。” 跑步狼说。 跑步狼和卡洛琳共同创立了一家名为Buffalo Tongue的非营利技术公司,专注于使用AI和沉浸式技术来恢复土著语言和文化。他们的项目旨在教育土著社区,使他们能够更好地控制自己的数据使用方式。 挑战 土著语言与拉丁语系的语言存在显著差异,这对现有机器学习框架提出了挑战。西方语言通常遵循主谓宾的句式结构,而土著语言往往是动词导向的,并且具有高度综合性,一个词可能包含多个元素。这种结构使得AI模型在预测下一个单词时表现不佳,因为它们主要是基于前一个单词进行预测。然而,通过增加更多语言数据的多样性,算法可以变得更灵活和适应性强,就像多语言者更容易学习新语言一样。 此外,由于土著社区对数据被滥用的长期不信任,许多社区不愿意使用基于AI的技术。跑步狼表示,很多研究在没有征得土著社区同意的情况下进行,导致这些社区对参与相关项目心存疑虑。 结果 为了克服这些犹豫,跑步狼积极参与创建了多种资源。他曾经是亚马逊员工网络小组的一员,帮助建立了一个专门讨论土著研究人员议题的平台。后来,他和卡洛琳还启动了两个更广泛的项目——“Indigenous in AI”和“IndigiGenius”,分别与其他组织合作,推动土著领导的人工智能努力。 2019年,跑步狼夫妇参加了两次研讨会,与其他数十名研究者一起撰写了一份关于如何伦理地设计和创造AI工具的报告。他们的目标是通过标准化的教学方法和技术资源,培养新的语言教师,增强社区对语言恢复的参与度。 业内评价与公司背景 跑步狼的工作被描述为既复杂又充满挑战,因为他不仅需要精通AI技术,还需理解和尊重土著文化的神圣性。业内人士如Estakio Beltran指出,“跑步狼的工作之所以如此高明,是因为他能在科技和文化之间架起桥梁”。作为非营利组织“Native Americans in Philanthropy”的合作顾问,Beltran认为跑步狼是恢复土著语言的关键人物,他的主要目标是保护和支持土著社区的主权。这一领域目前仍处于早期阶段,但跑步狼的努力已经在一定程度上提高了人们对土著文化和数据权益的关注和认识。

相关链接