字節跳動推出OmniHuman-1,這是一款能夠從單張照片生成逼真視頻的AI工具。該技術在弱信號輸入(如音頻)下表現良好,支持任何比例的圖像輸入(頭像、半身或全身),並生成高質量的逼真視頻。OmniHuman-1還可以重現歷史人物,如愛因斯坦在黑板前講話的視頻,展示自然的面部表情和手勢。南加州大學傳播學院教授Freddy Tran Nager稱該技術“非常令人印象深刻”,尤其在小屏幕如手機上使用時效果尤佳。