谷歌引领AI创新,首次让手机直接操作生成式AI模型

点此按钮收听本文语音

Google推出一套新的生成式AI模型“Gemini”,将首度可直接在手机上运作,这是该公司要和ChatGPT开发业者OpenAI等同业竞赛所取得的最新突破。

金融时报报道,Google将Gemini形容为该公司“最大、最有能力、最通用”的AI系统,可分析影像和声音资讯,并且具有复杂的推理和“规划”能力。

它从6日开始驱动Google的Bard聊天机器人,从明年起更广泛地整合入Google的搜寻引擎中。

“nano”版本可直接在手机上运作 将整合入Google最新手机

Gemini的其中一个版本“nano”,是专为在行动装置上运作而设计的,而且将整合到Google最新的Pixel手机中。Google表示,这会在手机上“原生运作”,而nano模型是针对手机而优化的,因此Android开发人员能够轻松地打造离线使用的AI应用程式(App)与功能,或者把个人资讯更加良好地储存在私人手机中。”

这样的进展有助于解答AI技术带来的经济问题。利用手机上可取得的运算能力就能运作生成式AI,而非透过由大型科技集团营运的云端伺服器来运作,将大幅降低运作生成式AI的成本。这也为希望把私密资料只保留在个人手机的人,提供了一层保障。

Google和Alphabet执行长皮伽在部落格文章中表示:“我相信,我们现在所看到的AI转型将是我们一生中最深远的转变,远远超过先前迈向手机或迈向网络的转变。”

Google在6日发表新的生成式AI模型“Gemini”,将首度可直接在手机上运作。图为Alphabet执行长皮伽5月在开发者大会上谈论Google的AI事业资料照片。(美联社)

—   广告   —

—  大洋海产 加拿大的急冻海鲜先锋  —

生成式AI在矽谷新辟一块战场,各大科技公司都争相称霸这块领域。此前,微软出资支持的OpenAI、Meta和Anthropic、Mistral等新创公司都发表了AI模型,都能用自然语言产生合理的答案来回应问题,包括用文字、程式码、图像和音档,而Google最新的生成式AI系统也跟进这一趋势。

上个月,微软在其广泛被使用的Microsoft 365生产力应用程式软体(包含Word、PowerPoint和Excel等)推出一款名为Copilot的生成式AI助理。

号称多项测试超越OpenAI的GPT4模型、将被整合入聊天机器人Bard

Google表示,Gemini在用来评估所谓的大型语言模型的产业标准基准测试中得分超过90%。

Google说,Gemini是第一款在特定任务上表现超越人类专家的AI模型,在多项测试中超越OpenAI的GPT4模型。特别的是,它能解决数学推理问题、分析科学数据和撰写高级程式码。Google在把新产品展示给记者看时,并未把它与GPT4的模型做比较,但后来在部落格厘清这点。

从6日起,Gemini也将被整合入Google由AI驱动的聊天机器人Bard的英语版本中,可在美国、亚洲和非洲等170多地使用,明年则规划要升级至威力更强大的软体。不过,这项产品暂时不在欧洲或英国提供,原因是面临监管障碍。

Google副总裁兼Bard总经理萧茜(Sissie Hsiao)表示,这次的整合将提高Bard在内容理解与摘要、推理、脑力激荡、写作和规划方面的能力。

Google展示的Gemini用途案例包括扫描手写的数学公式算式列、标出错误并给予解释。

科技类YouTuber马克·罗伯(Mark Rober)则展示利用整合Gemini的Bard来执导一段影片,内容是他测试如何手工打造最具空气动力学的纸飞机。AI建议进行实验并改善设计,以及如何测试其精准性的方法,包括让纸飞机射穿火圈。

Gemini版本将在12月提供给一些开发人员与企业客户,接著在明年更广泛推出。

来源:世界日报

分享文章到为新朋友圈
订阅评论
提醒
guest

0 评论
最旧
最新 最多投票
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x