社会热点
行业趋势|Google I/O 2024开发者大会有哪些看点?请收下这份2小时完整版-内容精要
2024-05-19 02:26  浏览:13

知识社区|行业趋势

“在Google,我们完全处于Gemini时代。在正式开始之前,我想回顾一下我们当下所处的时刻。十多年来,我们一直在投资人工智能,并在堆栈的每一层(研究、产品、基础设施)进行创新。尽管如此,我们仍处于AI平台转型的非常早期阶段。我们看到了摆在创作者、开发者、初创企业以及每一个人面前的,面向未来的巨大机遇。帮助推动这些机遇正是Gemini存在的意义所在。”——劈柴的开场白

? 快速导航 ?

04:57

Gemini即将加入Google搜索,人们的搜索体验即也将随之改变。人们可以尝试全新的方式进行搜索、通过更长更复杂的问题进行检索,以及图片搜索。

本周AI Overviews(伴随着全新的Google搜索体验)将在美国发布并很快推广到更多国家。

05:52

我们将可以尝试在Google Photos中,通过向照片提问的方式,搜索想要的生活答案。

今年夏天将推出包含更多功能的Asking Photos。

07:50

Gemini作为多模态大模型,可解锁“跨格式”知识。TA不仅能够理解各种类型的内容输入,还能找到它们之间的关联。

11:40

Gemini1.5 Pro正式面向用户发布,其上下文长度将突破性的可拓展至2百万个token!!拥有全世界迄今为止最长的上下文长度

12:48

Gemini可让人们在Gmail中搜索并整理电子邮件更加轻松便捷

  • 比如总结来自孩子学校的电子邮件;

  • 根据会议录音,总结会议要点

  • 让Gemini协助起草回复邮件

14:31

Gemini即将登陆Notebook LM,辅助个性化学习。

22:21

Google DeepMind 团队开发了基于Gemini的应用模型Alpha Fold 3,用于预测生命分子的结构和相互作用,包括蛋白质如何与DNA和RNA链相互作用。这将有助于加速生物学和医学研究,加速人类对疾病的理解到药物研发的过程。  

23:16

Gemini 1.5 Flash模型正式面向用户发布(后面还有更详细的介绍)

24:46

Project Astra 一个在日常生活中的通用AI助理,具有强大的视频理解功能。支持一边拍视频,一边实时地与视频内容进行交流、互动。或许在未来,通过手机或其他媒介(如眼镜)一个可以实时交互的专家助手就会出现于我们的身边。该功能将在今年晚些时候上线。

30:05

Imagen 3。Google迄今为止最强大的图像生成模型发布。现在起便可以注册试用ImageFX中的Imagen3。TA是Labs.google上的AI工具套件之一。

31:14

Music AI Sandbox。一个与Youtube合作构建的AI音乐沙盒工具,尝试探索另一个充满创造可能性的领域。

34:01

Veo 视频生成模型(类似于Sora)。TA能够很好地理解提示词中的细微差别,可以识别电影技巧和视觉效果。同时还将持续探索故事板和生成更长场景等功能。如果你感兴趣可以在Video FX中使用注册使用Veo。在未来的几周内,其中一些功能将通过Labs.google有选择性的提供给创作者,现等待名单已经开放。

38:57

一些硬件研发及合作进展

  • 发布第六代TPU,名为Trillium。Trillium的每个芯片的算力都比上一代提高了4.7倍,并将在2024年晚些时候为云端客户提供Trillium。

  • 上个月发布的新型Axion处理器,是基于ARM的定制CPU,也具有业界领先的性能和能效。

  • 与英伟达建立长期合作伙伴关系,成为NVIDIA尖端的Blackwell Gpus的云提供商之一,这些GPU将在2025年初上市。

44:18

 AI overviews 将如何充当我们生活中的小助手。AI overviews对解决复杂问题很有帮助,你可以同时提出一个问题及其所有子集问题,随后在几秒内便可获得答案概览overviews。TA像是一个私人助理,可以帮你做日常规划(如:旅行计划、饮食计划、约会聚会、锻炼计划等等)(小编感觉有点像“去哪儿/携程”&“大众点评”等app提供的服务合集)

50:41

在Google搜索中,可以使用视频进行提问,比如“为什么我的唱片机侧面的东西固定不住?”,你甚至不需要知道这台唱片机是什么牌子的,坏了的部件叫什么,如何修复它……,录一段视频,AI overview便能给你想要的答案和指导。

50:41

在Google搜索中,我们可以使用视频进行提问,比如“为什么我的唱片机侧面的东西固定不住?”,你甚至不需要知道这台唱片机是什么牌子的,坏了的部件叫什么,如何修复它……,录一段视频,AI overview便能给你想要的答案和指导。

56:49

Gmail Mobile即将推出的三项AI新功能。

“一键摘要按钮”:一键阅读邮件精要内容。

“问题输入栏”:当你在Gmail中提问,Gemini将协助你检索并汇总所有邮件内的相关细信息,而我们则不必一一查看每一封电子邮件及其附件内容,再进行信息拼凑。你可以说,比如,请汇总各家公司的的报价单,我的鞋子什么时候到?尼克斯比赛的大门什么时候打开?

回复建议栏”:Gemini将联系上下文给出回复方案。

这些新功能将在本月向实验室用户推出

59:50

Gemini尝试打破不同应用程序的壁垒,让协同工作在不同应用程序间无缝连接,而无需来回切换,甚至实现完全的自动化!

 对于自由职业者或小型企业来说,这可以帮助他们更加专心于自己的工作内容,而免于花费大量精力在簿记和物流信息整理上。

比如,你可以说“请帮我整理和跟踪我的收据”,Gemini则会帮助你自动整理各类收据,制作电子表格,并自动分门别类放入对应的文件夹中,且始终让表格和文件夹保持最新的状态。

比如,你可以说“请告诉我,我的钱都花在哪了?”Gemini则会帮助你制作这段时期账单的可视化明细表。

这些如:组织附件、驱动器、生成表格,并通过问答进行数据分析等的功能将于今年9月向实验室用户开放。

64:49

虚拟队友 AI Teammate。设置一位虚拟队友,并把TA拉进项目组的聊天室中,他便可以实时跟进项目的进展,随着团队将更多文件、信息添加到群聊中,虚拟队友便会拥有同样的“集体记忆”,从而帮助团队成员分担检索、总结、解决问题、发送工作文件等等工作。

69:07

Gemini App,重新定义我们与AI互动的方式。TA的多模态属性,允许我们使用“文本”“语音”“摄像头”多种方式来表达自己。今年夏天,我们便可以尝试用语音来和Gemini进行深入对话,这种新的体验被称做:Live。届时,你甚至可以在与Gemini对话时打断TA,而TA也会逐渐适应你的说话方式。

70:08

Gems 自定义机器人,你可以创建一个任意主题的个人专家(小编感觉此功能类似于GPTs)。TA可以扮演你的瑜伽好友、私人副厨师、聪明的微积分导师、代码同行评审员等等角色。

71:18

通过Gemini Advanced 规划全新旅行体验!我们都知道聊天机器人可以为我们的假期计划提供想法,但想要规划一次美好的旅行,还有很多额外的事情要做。需要考虑空间、时间、物流信息进行推理,以确定优先级,最终做出智能的决策。一个好的旅行规划,可以帮我们省下大量的时间。本功能将于今年夏天正式推出!(9月之前)

73:51

全世界迄今为止最长的上下文长度!2M!这意味着,你将可以上传长达1500页的PDF,30000行代码,或长达一小时的视频。举个栗子,如果你是一个学生,当你花了几个月的时间写了一篇论文,此时你迫切的需要一个全新的视角。那么这时你可以把整篇论文、资料、笔记、研究材料、采访录音和视频等等内容一股脑上传给Gemini。当Gemini拥有了所有这些背景信息,便可以为你提供可行的建议、分析你的论文要点,甚至可以扮演教授的角色给你一些修改建议。

75:23

Gemini可协助进行数据分析,你只需要上传所有相关的电子表格。Gemini便会自动编写Python代码来处理这些数据,并将你想要的信息分析汇总到一张图表中。本功能将在未来几周推出。

82:18

当Gemini连接Android操作系统,智能手机就真正智能起来了!通过Circle to Search功能,你只需要简单的在手机上画个圈,便能够解决涉及符号公式、图表、图形等的复杂问题。该功能可在安卓手机上使用!Gemini越来越像一位真正的AI小助手了!

88:13

Gemini的防诈骗提醒,可以帮助你在安卓端保护自己防范诈骗!Android15可以更新啦!

91:22

我们可以尝试的两种模型型号:Gemini1.5 Pro、Gemini1.5 Flash。Google Cloud用户,可前往AI Studio 或Vertex AI试用。访问ai.google.dev/gemini-api,您还可注册试用Gemini1.5 Pro的2M Token的超长上下文窗口。

92:17

新增加的开发者功能 New API features。视频帧提取、并行函数调用、上下文缓存(允许将所有文件一次性发送给模型)。该功能将于下个月正式发布。

92:53

更优惠的价格!对于Gemini1.5 Pro,售价7美元/1Mtokens。高达128k的提示词,半价优惠,将仅售3.5美元/1Mtokens。对于Gemini1.5 Flash,起始售价为0.35美元/1Mtokens。

93:59

谷歌将推出Gemma系列开源模型,致力于推动人工智能创新!!Gemma是基于与Gemini相同的研究和技术建构的,TA拥有很好的性能,并具有轻量级7B和2B两种大小。谷歌还将提供一系列预训练变体,如:RecurrentGemma、CodeGemma、PaliGemma(谷歌的第一个视觉语言开放模型)。而下一代产品Gemma2将于6月上市!Gemma2将比第一代Gemma增加27B 参数!!(经过英伟达的优化,Gemma2的大小可在下一代GPU上运行,并可在VertexAI中的单个TPU主机上高效运行!)真的非常期待,大家将会用TA来构建什么!

101:03

我们将如何构建更安全的AI来造福人类和社会(研究被忽视的疾病、预测洪水等),将如何改进模型并防止其被滥用,包括AI-assisted Red Teaming 等技术的开发与应用。

105:48

LearnLM,一款基于Gemini并针对学习进行微调的新的系列模型,或将开启AI时代谷歌学习和教育的新篇章。LearnLM以教育研究为基础,试图让学习体验更加个性化、更加有趣!一款名为Learning Coach的预制Gems也即将在未来几个月上线。借助Learning Coach,你可以获得分步骤及全方位的学习指导。

107:24

Youtube将增加一项新功能,通过引入LearnLM,让教育视频(如:讲座、研讨会等)更具互动性!Youtube的这项功能已面向部分Android用户推出。

109:40

 全场一共提到121次AI 

"让我们一起创造未来的无数种可能性吧!"

“人工智能已经帮助人们从日常任务转向那些最雄心勃勃、最富成效和最有想象力的事业”

end

我们期待「未来知识社区 | 镭射山谷BEAM VALLEY」可以成为科技与泛领域爱好者知识分享和交流的平台,连接世界上有共同愿景的个人,旨在促进科技与泛领域的知识融合。因此,我们心潮澎湃的期待您的加入与共建。让我们共同维系知识的动态发展,保持知识的生动性,保护每一份宝贵的热情与好奇心,一起创造更大的价值吧!

山谷欢迎你

在看充电门

点赞充电门

发表评论
0评