字節跳動推出OmniHuman-1，這是一款能夠從單張照片生成逼真視頻的AI工具。該技術在弱信號輸入（如音頻）下表現良好，支持任何比例的圖像輸入（頭像、半身或全身），並生成高質量的逼真視頻。OmniHuman-1還可以重現歷史人物，如愛因斯坦在黑板前講話的視頻，展示自然的面部表情和手勢。南加州大學傳播學院教授Freddy Tran Nager稱該技術“非常令人印象深刻”，尤其在小屏幕如手機上使用時效果尤佳。

<p>PANews報道，2月6日，據《福布斯》消息，TikTok的母公司字節跳動推出了AI工具OmniHuman-1，該工具可以根據單張照片生成高度逼真的視頻，包括人們說話、手勢、演奏樂器等動態影像。研究論文指出，該技術在弱信號輸入（如音頻）下表現良好，支持任意比例的圖像輸入（人像、半身像或全身像），並生成高質量的逼真視頻。在展示頁面上，OmniHuman-1還重現了歷史人物，如愛因斯坦在黑板前講話的視頻，展現出自然的面部表情和手勢。南加州大學傳播學院教授Freddy Tran Nager稱該技術“非常令人印象深刻”，並表示如果在手機等小屏幕上使用，效果尤其逼真。</p>

字節跳動推出OmniHuman-1：從單張照片生成逼真視頻的AI工具