大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 互联网

免费 AI “神器”系列第四弹:字节跳动发布视频界“神笔马良”,谷歌Gemini最强竞对出现

2024-02-21 简体 HK SG TW

今天小编分享的互联网经验:免费 AI “神器”系列第四弹:字节跳动发布视频界“神笔马良”,谷歌Gemini最强竞对出现,欢迎阅读。

图片来源:unsplash

近期,生成式人工智能(AIGC)领網域又涌现出多款创意十足的新应用。

今天,钛媒体 AGI 梳理了免费 AI " 神器 " 系列第四弹,共五款,其中不少产品又再一次拓宽了我们对 AI 的想象力。

视频界 " 神笔马良 " —— Boximator

大模型直接操控电腦—— ScreenAgent

文本转声音神器—— ElevenLabs 人工智能音效模型

谷歌 Gemini 1.5 最强竞对—— LargeWorldModel

阅读能力媲美人类—— Readagent

1、视频界 " 神笔马良 " ——字节 Boximator 模型

产品信息:Boximator 是一款由字节跳动开发的文生视频模型,可通过文本精准控制生成视频中人物或物体的动作。

产品功能:用户只需输入一句描述具体动作的文本,Boximator 便可生成对应动作的视频片段,目前很多文生视频大模型其实做不到这一点。

例如,同时在 Pika 1.0、Gen-2、Boximator 上输入文本 " 一位英俊的男人用右手从口袋中掏出一支玫瑰,并注视着这只玫瑰 ",三个大模型最终生成的视频中,只有 Boximator 做到了男士掏花和看花的动作,其他两个均没有。

只有 Boximator 的生成视频(最左)做到了男士掏花和看花的动作,其他两个均没有。

为了实现对视频中人物或物体动作的精准控制,Boximator 引入 " 硬盒 " 和 " 软盒 " 两种约束方法,用户可以使用这些盒子来严格定义对象在未来帧中的位置、形状或运动路径。

不过,Boximator 相关技术似乎还未成熟。

2 月 20 日,字节跳动相关人士表示,Boximator 是视频生成领網域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

据悉,字节跳动从 2023 年开始布局 AI,并于去年 11 月成立专注于 AI 创新业务的新部门 Flow。目前字节 Flow 部门已推出了三款 AI 对话类产品,包括豆包、扣子和 Cici。其中,豆包为一款聊天机器人产品,可以完成问答、文本生成、语言翻译等多种任务,还可以根据用户需求和上下文进行自适应问答,提供个性化服务;扣子是一站式 AI Bot 开发平台,无论用户是否有编程基础,都可以在扣子平台上快速搭建基于 AI 模型的各类问答 Bot,可完成解决简单的问答,并处理复杂逻辑的对话。

高管方面,前 TikTok 的产品负责人、现任字节跳动产品和战略副总裁朱骏已担任 Flow 产品负责人,此外还有一些内部核心产品人员转岗至 Flow。

体验地址:https://boximator.github.io/

2、谷歌 Gemini 1.5 最强竞对—— LargeWorldModel

产品信息:LargeWorldModel(LWM)是一种大型多模态自回归模型,由 UC 伯克利大学开发。它使用 RingAttention 在包含长视频和长文本的大型数据集上进行训练,从而执行语言、影像和视频的理解和生成。

产品功能:LWM 支持处理多模态信息,能在 100 万 token 中准确找到目标文本,还能一口气看完 1 小时的视频后,准确地回答出有关视频内容细节的问题,突破了当前语言模型在处理复杂的长格式任务的不足。除此之外,LWM 还支持影像和视频的生成,被外界视为谷歌 Gemini 1.5 最强竞对。

LargeWorldModel 产品介绍界面

体验地址:https://github.com/LargeWorldModel/LWM

3.   大模型直接操控电腦——ScreenAgent

产品信息:ScreenAgent 是一款由吉林大学人工智能学院开发、视觉语言大模型驱动的计算机控制代理。

产品功能:ScreenAgent 可帮助用户在无需辅助定位标签的情况下,通过 VLM Agent 控制电腦滑鼠和键盘,实现大模型直接操控电腦的功能。

ScreenAgent 可根据用户的文本描述查找并播放指定的视频

例如,ScreenAgent 可根据用户的文本描述查找并播放指定的视频,或根据用户要求调整视频播放速度。ScreenAgent 还能帮用户打开 Windows 系统的事件查看器,使用 office 办公軟體,例如根据用户文本描述,删除指定的 PPT 内容。

体验地址:https://github.com/niuzaisheng/ScreenAgent

4、文本转声音神器——ElevenLabs 人工智能音效模型

产品信息:近日,ElevenLabs 宣布将推出一款人工智能音效模型,可帮助用户通过文本生成音效,填补了当下 AI 视频生成缺乏背景音效的空白。

产品功能:在 ElevenLabs 发布的预告视频中,这款人工智能音效模型为 Sora 生成的视频画面添加了不同的音效,如人群中舞龙的喧闹声、高速列车运行的轰鸣声、行人的脚步声等。

目前,ElevenLabs 公布了一段视频,但尚未公开该模型的具体细节,仅设立了一个注册页面,用户可提前注册等待该模型的开放试用。

注册地址:https://form.typeform.com/to/gg0xzZW4?typeform-source=t.co

5、阅读能力超强的 Agent 模型—— Readagent

产品信息:Readagent 是由 Google 开发的一款模仿人类阅读方式的阅读类型代理(Agent)模型。它通过学习人类阅读长文本时遗忘具体信息但保留要点信息的方式,来提高处理和理解长文本的效率。

产品功能:在处理长文本时,Readagent 会把文本中的主要信息转化为 " 要点记忆 " 进行存储,当需要回答具体细节问题时,Readagent 会迅速定位到到相应的 " 要点 " 中寻找答案,从而出色地完成长文本的阅读理解任务。此外,Readagent 还能帮用户在复杂的网站中找到需要的信息。

体验地址:https://github.com/read-agent/read-agent.github.io/blob/main/assets/read_agent_demo.ipynb

(本文首发钛媒体 App,作者|任颖文,编辑|林志佳)

熱門排行
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們