免費AI“神器”第十三彈：會20種語言的數字人爆火；機器人能提前0.8秒預測人類表情

今天小編分享的互聯網經驗：免費AI“神器”第十三彈：會20種語言的數字人爆火；機器人能提前0.8秒預測人類表情，歡迎閲讀。

（圖片來源：unsplash）

近期，生成式人工智能（AIGC）領網域又湧現出多款創意十足的新應用。

今天，钛媒體 AGI 梳理了免費 AI " 神器 " 系列第十三彈，共五款，其中不少產品再一次拓寬了我們對 AI 的想象力。

會 20 種語言的克隆數字人—— Digen

能模仿人類表情的人形機器人—— EMO

Domo AI 新功能上線：能讓靜态人像動起來

吊打 Midjourney 的 AI 文生圖工具—— Ideogram

文生圖框架—— LaVi-Bridge

1、會 20 種語言的克隆數字人—— Digen AI

產品信息：Digen 是由 Digen AI 研發的全新克隆數字人工具產品，稱是利用生成式 AI 技術創建面向未來的視頻，支持多達 20 種語言、40+ 種聲音，手勢、口型和語調全部同步一致，視頻效果比較逼真。

產品功能：用户可通過官網申請内測，使用時免費進行個性化頭像生成，大約需要 5-7 天時間，随後可以進行視頻編輯和生成等操作，最終可以實現數字人視頻狀态，聲稱為 Digen in Real Motion 1.0。

目前，Digen 包括免費版、創作者版、專業版三個版本，後兩者每月計費分别為 9.9 美元、19.9 美元，如果按年訂閲價格會更低一些。公司稱，免費計劃的訂閲者不受任何時間限制，但每月只能制作總長度為 2 分鍾的視頻，視頻數量沒有限制。

有分析稱，Digen 是 Sora、Heygen、PIKA、Runway 等產品的強有力競品之一。

用户可通過 https://digen.ai 填寫信息申請内測資格。

2、能模仿人類表情的機器人—— EMO

產品信息：哥倫比亞大學創新機器實驗室近日推出一款可以預測人的表情，并能與人類同步做出表情的人臉機器人。這款機器人采用自我監督學習框架，運作原理類似于人類通過照鏡子來練習面部表情。

產品功能：EMO 可以在人類微笑前 839 毫秒預測即将到來的微笑，并通過模型與人類同時表達微笑。此外，Emo 還可以預測悲傷、憤怒和驚訝等表情，還能與人類進行眼神互動，但目前還不能做出人類的所有表情。

據了解，Emo 的眼睛裏裝有攝像頭，硅膠皮膚下有 26 個電機，類似于人類面部的肌肉，可以為機器人的面部表情提供動力。另外，該機器人使用兩個神經網絡，一個用來觀察人臉并預測表情，另一個研究如何在機器人臉上產生表情。第一個神經網絡通過視頻網站上的視頻進行訓練，第二個神經網絡讓機器人通過實時攝影機觀看自己做的表情來訓練。

團隊研究人員表示，未來，他們還将拓寬機器人的表情範圍，希望 EMO 能對人所説的話做出反應，而不是簡單模仿人類。此外，研究人員正利用大模型将語言交流整合到 Emo 中，讓 Emo 能夠回答問題和對話。

3、Domo AI 新功能上線：能讓靜态人像動起來

產品信息：Domo AI 是映刻科技推出的一款将照片和視頻動漫化的 AI 工具，該工具可以将用户上傳的圖片和視頻轉繪為動漫風格，經過不斷迭代更新，Domo AI 近日推出了影像生成視頻新功能。

產品功能：Domo AI 的新功能結合了深度學習和計算機視覺算法的前沿技術，通過智能識别和分析靜态照片中的人物特征，再與動态視頻中的運動數據進行精準匹配。在強大的算法驅動下，Domo AI 能夠巧妙地将照片中的人物 " 移植 " 到視頻中，實現靜态到動态的完美轉變。

例如，用户可以上傳一張靜态照片和一個參考的動态視頻，Domo AI 便能夠巧妙地将靜态照片中的人物替換成動态視頻中的人物，實現驚人的視覺轉換。

Domo AI 功能強大，适用于多種場景和應用。不僅可用于社交媒體上分享生動有趣的動态照片，還可以為電影、遊戲或廣告制作添加特效，為用户提供無限的創意空間。

目前，Domo AI 新功能已經在 Discord 頻道上正式上線，用户只需在頻道内使用 /move 命令，即可輕松體驗将靜态照片變為動态視頻的神奇過程。

官方網址：https://domoai.app/

體驗地址：https://discord.gg/domoai

4、吊打 Midjourney、DALL · E 3 的 AI 文生圖工具—— Ideogram

產品信息：Ideogram 是一款超強文字生成影像工具，旨在生成包含可以清晰閲讀文本的影像。該模型由谷歌前員工組成的創業團隊打造，團隊成員曾參與開發谷歌的 Imagen 影像生成軟體和視頻生成模型。

產品功能：Ideogram 的主要功能為文生圖功能，但與其他影像生成模型不同的是，Ideogram 擅長生成包含文本的圖片，用户只需輸入提示詞，Ideogram 就可以按照要求将文字融入生成的圖片中，實現平面、懸浮甚至立體文字效果。比如生成電影、產品海報、T 恤印花等影像，解決了生圖 AI 在影像文字生成上的痛點。

近期上線的 Ideogram 1.0 版本在正确顯示文本方面有了顯著提升，生成的影像也更加逼真，可以對復雜提示詞進行精确響應。Ideogram 表示，參與測試的評估者對于 Ideogram 1.0 在提示對齊、影像連貫性、整體偏好和文本渲染質量方面的偏好超越了 DALL · E 3 和 Midjourney V6。

同時 Ideogram 1.0 還引入了一個名為 " 魔法提示 " 的新功能，該功能可以根據用户的原始描述，編寫更詳細的提示詞，進而創造出更美觀且具創意的影像。

此外，Ideogram 1.0 版本還能理解冗長、復雜的提示詞，生成清晰、逼真的影像，包括動物、奇怪組合的呈現，以及照片級逼真的人物表情和手部動作。

付費方面，用户每天能免費使用 25 個提示詞，生成 100 張圖。8 美元月付費用户每天可以生成 100 個提示詞，400 張圖。20 美元月付費用户可以無限使用。

體驗地址：https://ideogram.ai/t/explore

5、文生圖框架—— LaVi-Bridge

產品信息：LaVi-Bridge 是一個無需訓練将不同的語言模型和生成視覺模型結合起來，以實現文本到影像的生成的技術框架，該框架由香港大學、香港中文大學和香港科技大學的研究團隊共同開發。