谷歌Gemini解锁付费新技能,照片转视频功能全面开放

优秀先生

谷歌母公司Alphabet(GOOGL.US)宣布,将面向付费用户开放"照片转视频"功能,这项年初仅限小范围测试的人工智能工具现正式登陆Gemini人工智能助手。

该公司声明称,自周四起,特定地区订阅Google AI Ultra和Pro计划的用户可通过Gemini网页版使用该功能,移动端应用将在本周内陆续推送更新。

这项新功能允许用户基于单张照片及文本描述,生成带声音的8秒短视频。生成的MP4格式视频分辨率为720p,采用16:9横向画幅。

此次更新使该功能直接集成至Gemini聊天界面,标志着谷歌在AI视频领域与美国竞争对手OpenAI、Runway AI Inc.保持同步。全球市场竞争同样激烈:中国阿里巴巴集团、AI初创企业Manus和快手科技过去数月均发布了升级版视频工具。

该功能由谷歌五月在开发者大会发布的最新一代视频生成模型Veo 3驱动,此前仅限通过独立付费影视工具Flow使用。

谷歌强调已采取"重要后台措施确保视频生成符合规范",例如禁止使用公众人物(包括名人、政要及知名企业家)图像生成视频,其政策同时禁止煽动危险行为、暴力或群体攻击的内容。

但测试显示技术仍存缺陷。媒体在Gemini网页版实测中发现:上传个人照片要求生成人物讲话视频时,输出结果多次改变面部特征甚至人种;虽然能成功实现"植物随风摆动"或"静态猫片说话"等简单指令,但对"照片人物跳霹雳舞"等复杂要求,仅生成人物挥手画面。

谷歌发言人就测试结果回应称,AI模型并无修改人物外貌的设定指令,照片转视频及面部动画仍属新技术,可能基于单张图像生成与原始内容不符的结果。

该模型更擅长活化其他场景,如日常物品动画化、画作动态化及自然照片增运动效果,公司将在后续更新中持续改进包括面部动画在内的各项功能。

相关推荐:

2025澳门特马今晚开奖图纸大全下载-核实商品真伪

2025澳正版资料免费大全,关注接口文档

聚财堂3246免费资料大全最新版本下载,可信度判断

4949正版资料龙门客栈——条款解读

7777788888新澳门正版——警惕加盟欺诈

澳门三肖三淮100淮管家婆——对比研究

7777788888四肖免费今晚开奖结果兑换流程分析

马会传真资料_辨识平台导购

79456濠江论坛最新消息22324——坚持冷静判断

澳门今天挂牌正版挂牌完整挂牌,渠道认证解析

澳门三期内必开一肖精选——维权难点解析

四不像特马图今晚必出,对比研究

白小姐三期必开一肖_重视实名认证

奥门正版图库恢复重启-合法报销提示

白小姐今晚一肖中特开奖319期-调用机制说明

文章版权声明:除非注明,否则均为谷歌Gemini解锁付费新技能,照片转视频功能全面开放原创文章,转载或复制请以超链接形式并注明出处。