首页 > 生活分享 > 免费教学 > 谷歌Gemini预告片展示惊艳语音视频交互能力

谷歌Gemini预告片展示惊艳语音视频交互能力

发布时间:2024-05-14 23:17:16来源: 15210273549

 5 月 14 日消息,人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。

这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。

 

整个对话过程自然流畅,Gemini 还会询问用户注意到的细节,成功识别出了该活动为谷歌 I / O 开发者大会,并进行了简要介绍。

谷歌发布该预告片的时机非常巧妙,恰好在 OpenAI 有关 ChatGPT 的发布会前几个小时,OpenAI 在此发布会上推出了全新的 ChatGPT-4o 大模型,其理解和对话的流畅性以及连贯性方面都达到了无与伦比的水平。

虽然过去的一些演示视频让外界对这类内容持有一定的怀疑态度,但今天展示的案例无疑证实了人工智能聊天机器人可以无缝集成语音和视频输入。这种多模态能力,加上非常自然的对话流,让我们仿佛看到了未来人工智能交互的一瞥。

谷歌 I / O 大会主题演讲将于明天凌晨 1 点举行,届时IT之家将第一时间带来相关报道。

免费教学更多>>

华为公开最新专利!将在Pura80系列上首发应用 从行业先驱到转型先锋 华为云助力华新水泥持续开拓海外市场 国产厂商最新旗舰机激活量排名 华为小米旗鼓相当 机情问答:华为Pura 80会涨价吗 REDMI电竞平板咋样? 时隔两年 OPPO或再推小折叠屏手机 朵薇卫生巾销量位居抖音前三,已引入新产线突破产能瓶颈 “钢铁门神”陆天宇:守好球门,捍卫城市荣耀 荣耀五载,启航新程:太吉之源大健康产业联盟五周年庆典盛大启幕 时尚中国 荣耀东方——2025中国时尚产业盛典即将开幕 手机点点也能办 昆山车驾管服务交出便民利企“暖心答卷” 索尼Alpha 7R V全画幅相机优惠价20003元 最强手感小直屏来了!魅族22系列入网:首次安排潜望长焦 小米MIX Flip 2折叠屏手机即将发布 小米Xiaomi15 5G手机12GB+512GB白 骁龙8至尊版到手价1713元 3台重磅SUV携新技术来:小米YU7不可能23.59万?上汽大众有新招 雷军:小米SU7已交付超25万台 淄博启动第20届爱心助考活动,齐国华为出租车张贴爱心车贴 华为一新机将发布,8万人预约背后有啥惊喜 何小鹏余承东AEB之争早已翻篇,小鹏华为联合研发ARHUD 天聚地合携手华为,打造AI+警务政企“芯”场景,开启数智化新篇章 OPPO与大众达成全球专利许可协议,彰显5G技术实力 三款三星 Galaxy 平板生命周期结束,将停止获得安全更新 华硕ROG XG27UCS电竞显示器限时特惠1529元 联想至像 T34 M3 Plus 打印机:打造智能企业高效办公新体验 梧州市电商以“数商兴农”为引领 推动传统业与电商融合发展 陕西省定边县举办职工电商直播技能大赛 京东首次上线开源鸿蒙穿戴专区:299元起就能买鸿蒙5.0手表 京东校园之星才艺大奖赛区域赛开赛,武汉赛区竞赛时间确定 伯恩光学荣获BOE京东方“卓越品质奖” 酒类消费回归“品牌力”,天猫618酒水消费爆发,白酒、葡萄酒、黄酒高速增长