大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科技

AI又一突破,“眼神打字”更快更省力,研究登上Nature子刊

2024-11-25 简体 HK SG TW

今天小编分享的科技经验:AI又一突破,“眼神打字”更快更省力,研究登上Nature子刊,欢迎阅读。

因渐冻症(ALS)等病症而无法言语或打字的人群不容忽视,他们在日常沟通交流中面临着巨大障碍,急需有效的辅助手段来打破沟通壁垒。

尽管辅助性 / 替代性沟通(AAC)设备及眼动打字技术虽能提供一定支持,但频繁的按键操作极易导致眼疲劳和时间成本,严重阻碍了运动障碍患者进行自然流畅的对话以及充分表达自我,进而影响生活质量。

为解决这一问题,来自谷歌的研究团队及其合作者开发了一个由大语言模型(LLM)驱动的用户界面(UI)—— SpeakFaster。

据介绍,SpeakFaster利用经过微调的 LLM 和会话语境,能以极高的准确率将高度缩略的英文文本(仅为单词首字母,必要时还会添加字母和单词)扩展为所需的完整短语,帮助 ALS 患者眼动打字按键次数减少了 57%,文本输入速度比 baseline 提高了 29-60%。

相关研究论文以 "Using large language models to accelerate communication for eye gaze typing users with ALS" 为题,已发表在 Nature 子刊 Nature Communications 上。

这些结果表明,通过大幅提高文本输入速度并减少身体压力,SpeakFaster 可以帮助严重运动障碍患者更准确、更高效地交流,使他们能够更充分地参与对话,从而提高独立性、社会参与度、自我表达能力和生活质量。

让渐冻症患者更好地沟通

SpeakFaster 提供了一种基于人工智能(AI)的方法,将 LLM 与专为缩写文本输入而设计的 UI 结合。

具体而言,研究团队首先对 SpeakFaster 的 UI 进行了设计,从而确保其允许轻松输入和优化缩写,保证用户始终能够传达他们想要的信息,即使初始预测不是他们想要的。

他们此前证明,经过微调的 LaMDA(64B 参数)可以将单词首字母形式的缩写(例如 "ishpitb")扩展为完整短语(例如 "I saw him play in the bed"),在提供对话上下文(即另一位说话者的轮次)时,准确率高达 77%。无法找到精确匹配的情况往往发生在更长、更复杂的短语上。

图|SpeakFaster UI 中缩写文本输入的主要互動途径:仅首字母路径。

虽然很有希望,但实际的解决方案需要确保用户在初始缩写扩展(AE)失败的情况下能够随后输入任何任意的短语,即用户在 UI 中永远不会遇到 " 死胡同 "。因此,他们开发了一个 UI 和两个底层微调的 LLM,作为完整、实用的解决方案。

其中,KeywordAE 能够扩展混合首字母和完整或部分拼写单词的缩写。KeywordAE 模型还能够扩展仅由首字母组成的缩写,因此提供了此前他们工作功能的超集。

图|KeywordAE UI 途径。

FillMask 则能够在周围单词的上下文中提供以给定首字母开头的备选单词。两个模型均使用从四个公共英语对话数据集中合成的大约 180 万个独特的三元组 { 上下文、缩写、完整短语 } 进行微调。

图|FillMask UI 路径。

为了形成通往微调 LLM 的通道,他们还设计了一个具有三个路径的 UI,即 Initials-only AE、KeywordAE 和 FillMask,以支持完整的缩写文本输入体验。

Initials-only AE 是 SpeakFaster UI 中所有短语输入工作流程的共同起点。在三个路径中,它涉及的按键和眼动点击次数最少,仅首字母路径就足以满足简短和可预测的短语。当用户输入缩写时,UI 在每个按键后自动触发对 KeywordAE LLM 的调用,包括用户键入的缩写以及所有之前的对话轮次作为 LLM 的输入。每个调用返回基于对话上下文和缩写的 top-5 最有可能的选项,这些选项在 UI 中呈现给用户浏览和选择。

如果通过仅首字母路径没有找到预期短语,那么 SpeakFaster UI 提供了两种替代 UI 路径来帮助用户找到预期短语。

第一种替代 UI 路径是 KeywordAE,允许用户拼写多个单词。每次按键后都会自动触发对 KeywordAE 的调用,而每次调用后,UI 将呈现 KeywordAE LLM 返回的最新 top-5 短语扩展。

第二种替代 UI 路径是 FillMask,这是从找不到精确预期短语的失败中恢复的另一种方法。与 KeywordAE 不同,FillMask 仅适用于扩展中的非常少(通常是单个单词)单词不正确的情况。

KeywordAE 和 FillMask 是两种替代互動模式,用于从通过仅首字母路径无法获得预期短语中恢复。在当前研究中,SpeakFaster UI 允许用户在使用 KeywordAE 模式后使用 FillMask 模式,这对于在难以预测的短语中找到正确的单词很有用。

图|由 KeywordAE 和 FillMask 辅助的短语输入模拟策略。

这样一来,当使用 SpeakFaster 时,用户首先输入他们想要的短语中单词的首字母。然后,经过微调的 LLM 会预测整个短语,并根据这些首字母和对话上下文显示最可能的短语。如果所需短语不在选项中,用户可以通过拼出关键词或选择替代词来优化预测。这种方法大大减少了所需的按键次数,从而加快了沟通速度。

之后,为评估 SpeakFaster UI 界面节省用户操作动作的大致上限,研究团队开展了模拟实验。他们使用 Turk Dialogues 语料库,模拟了三种不同的用户互動策略:

策略 1:使用首字母缩写进行 AE,如果失败则使用 KeywordAE 进行迭代拼写,直到找到匹配的短语。策略 2:与 Strategy 1 相同,但每当最佳匹配短语候选词中只剩下一个错误单词时,就使用 FillMask 进行替换。策略 2A:Strategy 2 的变体,更积极地使用 FillMask,即在最佳选项中剩下两个或更少的错误单词时立即使用。

与 Gboard 的预测 baseline 相比,SpeakFaster 在三种策略下都实现了显著的按键节省。在 Strategy 2 下,使用 KeywordAE v2 模型,SpeakFaster 实现了 0.657 的按键节省率(KSR),比 Gboard 的 KSR(0.482) 高出 36%。这表明,利用 LLM 的上下文感知能力和 FillMask 的词替换功能,可以在很大程度上提高文本输入效率。

模拟结果还表明,SpeakFaster 在提供 5 个最佳短语选项的情况下表现最佳,并且对话上下文对于 LLM 的预测能力至关重要。

图|模拟实验结果表明,SpeakFaster UI 可大幅节省按键。

除了模拟实验外,研究团队还进行了用户研究,从而测试 SpeakFaster 的有效性。

研究团队测量了动作节省(与要输入的完整字元集相比节省的按键次数)、实用性(每分钟的打字速度)和SpeakFaster UI 的可学习性(人们需要多少练习才能习惯使用该系统)这三个指标以评估 SpeakFaster 界面。

在运动节省指标方面,与传统 baseline 相比,SpeakFaster 为 ALS 眼动用户和非 AAC 参与者提供了大量按键动作节省。对于非 AAC 用户,SpeakFaster 在脚本场景中可实现 56% 的按键节省,在非脚本场景中可实现 45% 的按键节省。对于 ALS 眼动用户,SpeakFaster 还在脚本阶段显著节省了按键。

图|左图:非 AAC 用户的 KSR。右图:ALS 眼动用户的 KSR。橙色和紫色条显示使用 SpeakFaster 系统时的 KSR,蓝色和绿色条显示使用 baseline 智能键盘时的 KSR。

在实用性指标方面,对于非 AAC 用户来说,整体文本输入速度与传统打字速度相当。然而,在针对一位 ALS 眼动用户的实验室研究显示,SpeakFaster 使脚本阶段的打字速度提高了 61.3%,非脚本阶段的打字速度提高了 46.4%。

图|左图:对于非 AAC 用户,脚本阶段和非脚本阶段的整体文本输入速度没有出现显著变化。右图:对于 ALS 眼动用户,SpeakFaster 显著提高了脚本阶段和非脚本阶段的速度。

除了节省动作和提升打字速度外,学习曲线和所引入的认知负荷也是评估打字系统和 UI 的关键指标。虽然与非 AAC 用户相比,ALS 眼动用户在使用 SpeakFaster 时最初的学习曲线略慢,但只需 15 个练习对话,ALS 眼动用户就能达到舒适的打字速度。

图|通过为非 AAC 用户提供 6 个练习对话和为 ALS 眼动用户提供 15 个练习对话,参与者能够学习 SpeakFaster 系统达到每分钟 20-30 个单词的舒适打字速度(显示在 y 轴上)。

虽然各项实验表明 SpeakFaster 帮助严重运动障碍患者实习高效交流方面具有独特优势,但目前该研究还存在有模型语言单一、短语长度受限、服务成本高昂以及研究样本量较少等局限。

AI 正在改善残障人士生活

SpeakFaster 并非首个致力于改善残障人士生活的 AI 项目。

2019 年,BrightSign 推出了一款基于 AI 的智能手套。该手套内置预定义手语库,能将手势转化为语音,结合机器学习算法,可让让听力或语言障碍者双向交流、独立与他人直接沟通,行动受限者如中风患者或听力丧失老人也可使用。

2021 年,加州大学旧金山分校 Chang Lab 团队首次用腦机接口帮助一位瘫痪超过 15 年的失语男子 BRAVO1 恢复了 " 说话 " 能力。该研究通过在被试者大腦内植入电极的深度神经读取技术帮助被试者实现腦与设备的信息交换,从而恢复其与世界沟通的能力。(点击查看详情)

2024 年,OpenAI 推出了 Voice Engine 模型的小规模预览成果。该模型使用文本输入和单个 15 秒音频样本来生成与原始说话者非常相似的自然语音,已经帮助一名因血管性腦肿瘤而失去流利语言能力的年轻患者恢复声音。(点击查看详情)

2024 年,北卡罗来纳州立大学与北卡罗来纳大学教堂山分校的苏浩教授团队提出了一种在计算机仿真环境中通过强化学习来让机器人学习控制策略的新方法,有望极大地提高老年人,行动障碍人士和残疾人的生活质量。

相信在不久的将来,AI 将进一步改善残障人士的生活。

熱門排行
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們