行业趋势|Google I/O 2024开发者大会有哪些看点?请收下这份2小时完整版-内容精要_社会热点_资讯_免费发布网

社会热点

行业趋势|Google I/O 2024开发者大会有哪些看点?请收下这份2小时完整版-内容精要

2024-05-19 02:26 浏览:23

知识社区｜行业趋势

“在Google，我们完全处于Gemini时代。在正式开始之前，我想回顾一下我们当下所处的时刻。十多年来，我们一直在投资人工智能，并在堆栈的每一层（研究、产品、基础设施）进行创新。尽管如此，我们仍处于AI平台转型的非常早期阶段。我们看到了摆在创作者、开发者、初创企业以及每一个人面前的，面向未来的巨大机遇。帮助推动这些机遇正是Gemini存在的意义所在。”——劈柴的开场白

? 快速导航 ?

04:57

Gemini即将加入Google搜索，人们的搜索体验即也将随之改变。人们可以尝试全新的方式进行搜索、通过更长更复杂的问题进行检索，以及图片搜索。

本周AI Overviews（伴随着全新的Google搜索体验）将在美国发布并很快推广到更多国家。

05:52

我们将可以尝试在Google Photos中，通过向照片提问的方式，搜索想要的生活答案。

今年夏天将推出包含更多功能的Asking Photos。

07:50

Gemini作为多模态大模型，可解锁“跨格式”知识。TA不仅能够理解各种类型的内容输入，还能找到它们之间的关联。

11:40

Gemini1.5 Pro正式面向用户发布，其上下文长度将突破性的可拓展至2百万个token！！拥有全世界迄今为止最长的上下文长度

12:48

Gemini可让人们在Gmail中搜索并整理电子邮件更加轻松便捷

比如总结来自孩子学校的电子邮件；
根据会议录音，总结会议要点
让Gemini协助起草回复邮件

14:31

Gemini即将登陆Notebook LM，辅助个性化学习。

22:21

Google DeepMind 团队开发了基于Gemini的应用模型Alpha Fold 3，用于预测生命分子的结构和相互作用，包括蛋白质如何与DNA和RNA链相互作用。这将有助于加速生物学和医学研究，加速人类对疾病的理解到药物研发的过程。

23:16

Gemini 1.5 Flash模型正式面向用户发布（后面还有更详细的介绍）

24:46

Project Astra 一个在日常生活中的通用AI助理，具有强大的视频理解功能。支持一边拍视频，一边实时地与视频内容进行交流、互动。或许在未来，通过手机或其他媒介（如眼镜）一个可以实时交互的专家助手就会出现于我们的身边。该功能将在今年晚些时候上线。

30:05

Imagen 3。Google迄今为止最强大的图像生成模型发布。现在起便可以注册试用ImageFX中的Imagen3。TA是Labs.google上的AI工具套件之一。

31:14

Music AI Sandbox。一个与Youtube合作构建的AI音乐沙盒工具，尝试探索另一个充满创造可能性的领域。

34:01

Veo 视频生成模型（类似于Sora）。TA能够很好地理解提示词中的细微差别，可以识别电影技巧和视觉效果。同时还将持续探索故事板和生成更长场景等功能。如果你感兴趣可以在Video FX中使用注册使用Veo。在未来的几周内，其中一些功能将通过Labs.google有选择性的提供给创作者，现等待名单已经开放。

38:57

一些硬件研发及合作进展

发布第六代TPU，名为Trillium。Trillium的每个芯片的算力都比上一代提高了4.7倍，并将在2024年晚些时候为云端客户提供Trillium。
上个月发布的新型Axion处理器，是基于ARM的定制CPU，也具有业界领先的性能和能效。
与英伟达建立长期合作伙伴关系，成为NVIDIA尖端的Blackwell Gpus的云提供商之一，这些GPU将在2025年初上市。

44:18

AI overviews 将如何充当我们生活中的小助手。AI overviews对解决复杂问题很有帮助，你可以同时提出一个问题及其所有子集问题，随后在几秒内便可获得答案概览overviews。TA像是一个私人助理，可以帮你做日常规划（如：旅行计划、饮食计划、约会聚会、锻炼计划等等）（小编感觉有点像“去哪儿/携程”&“大众点评”等app提供的服务合集）

50:41

在Google搜索中，可以使用视频进行提问，比如“为什么我的唱片机侧面的东西固定不住？”，你甚至不需要知道这台唱片机是什么牌子的，坏了的部件叫什么，如何修复它……，录一段视频，AI overview便能给你想要的答案和指导。

50:41

在Google搜索中，我们可以使用视频进行提问，比如“为什么我的唱片机侧面的东西固定不住？”，你甚至不需要知道这台唱片机是什么牌子的，坏了的部件叫什么，如何修复它……，录一段视频，AI overview便能给你想要的答案和指导。

56:49

Gmail Mobile即将推出的三项AI新功能。

“一键摘要按钮”：一键阅读邮件精要内容。

“问题输入栏”：当你在Gmail中提问，Gemini将协助你检索并汇总所有邮件内的相关细信息，而我们则不必一一查看每一封电子邮件及其附件内容，再进行信息拼凑。你可以说，比如，请汇总各家公司的的报价单，我的鞋子什么时候到？尼克斯比赛的大门什么时候打开？

“回复建议栏”：Gemini将联系上下文给出回复方案。

这些新功能将在本月向实验室用户推出

59:50

Gemini尝试打破不同应用程序的壁垒，让协同工作在不同应用程序间无缝连接，而无需来回切换，甚至实现完全的自动化！

对于自由职业者或小型企业来说，这可以帮助他们更加专心于自己的工作内容，而免于花费大量精力在簿记和物流信息整理上。

比如，你可以说“请帮我整理和跟踪我的收据”，Gemini则会帮助你自动整理各类收据，制作电子表格，并自动分门别类放入对应的文件夹中，且始终让表格和文件夹保持最新的状态。

比如，你可以说“请告诉我，我的钱都花在哪了？”Gemini则会帮助你制作这段时期账单的可视化明细表。

这些如：组织附件、驱动器、生成表格，并通过问答进行数据分析等的功能将于今年9月向实验室用户开放。

64:49

虚拟队友 AI Teammate。设置一位虚拟队友，并把TA拉进项目组的聊天室中，他便可以实时跟进项目的进展，随着团队将更多文件、信息添加到群聊中，虚拟队友便会拥有同样的“集体记忆”，从而帮助团队成员分担检索、总结、解决问题、发送工作文件等等工作。

69:07

Gemini App，重新定义我们与AI互动的方式。TA的多模态属性，允许我们使用“文本”“语音”“摄像头”多种方式来表达自己。今年夏天，我们便可以尝试用语音来和Gemini进行深入对话，这种新的体验被称做：Live。届时，你甚至可以在与Gemini对话时打断TA，而TA也会逐渐适应你的说话方式。

70:08

Gems 自定义机器人，你可以创建一个任意主题的个人专家（小编感觉此功能类似于GPTs）。TA可以扮演你的瑜伽好友、私人副厨师、聪明的微积分导师、代码同行评审员等等角色。

71:18

通过Gemini Advanced 规划全新旅行体验！我们都知道聊天机器人可以为我们的假期计划提供想法，但想要规划一次美好的旅行，还有很多额外的事情要做。需要考虑空间、时间、物流信息进行推理，以确定优先级，最终做出智能的决策。一个好的旅行规划，可以帮我们省下大量的时间。本功能将于今年夏天正式推出！（9月之前）

73:51

全世界迄今为止最长的上下文长度！2M！这意味着，你将可以上传长达1500页的PDF，30000行代码，或长达一小时的视频。举个栗子，如果你是一个学生，当你花了几个月的时间写了一篇论文，此时你迫切的需要一个全新的视角。那么这时你可以把整篇论文、资料、笔记、研究材料、采访录音和视频等等内容一股脑上传给Gemini。当Gemini拥有了所有这些背景信息，便可以为你提供可行的建议、分析你的论文要点，甚至可以扮演教授的角色给你一些修改建议。

75:23

Gemini可协助进行数据分析，你只需要上传所有相关的电子表格。Gemini便会自动编写Python代码来处理这些数据，并将你想要的信息分析汇总到一张图表中。本功能将在未来几周推出。

82:18

当Gemini连接Android操作系统，智能手机就真正智能起来了！通过Circle to Search功能，你只需要简单的在手机上画个圈，便能够解决涉及符号公式、图表、图形等的复杂问题。该功能可在安卓手机上使用！Gemini越来越像一位真正的AI小助手了！

88:13

Gemini的防诈骗提醒，可以帮助你在安卓端保护自己防范诈骗！Android15可以更新啦！

91:22

我们可以尝试的两种模型型号：Gemini1.5 Pro、Gemini1.5 Flash。Google Cloud用户，可前往AI Studio 或Vertex AI试用。访问ai.google.dev/gemini-api，您还可注册试用Gemini1.5 Pro的2M Token的超长上下文窗口。

92:17

新增加的开发者功能 New API features。视频帧提取、并行函数调用、上下文缓存（允许将所有文件一次性发送给模型）。该功能将于下个月正式发布。

92:53

更优惠的价格！对于Gemini1.5 Pro，售价7美元/1Mtokens。高达128k的提示词，半价优惠，将仅售3.5美元/1Mtokens。对于Gemini1.5 Flash，起始售价为0.35美元/1Mtokens。

93:59

谷歌将推出Gemma系列开源模型，致力于推动人工智能创新！！Gemma是基于与Gemini相同的研究和技术建构的，TA拥有很好的性能，并具有轻量级7B和2B两种大小。谷歌还将提供一系列预训练变体，如：RecurrentGemma、CodeGemma、PaliGemma（谷歌的第一个视觉语言开放模型）。而下一代产品Gemma2将于6月上市！Gemma2将比第一代Gemma增加27B 参数！！（经过英伟达的优化，Gemma2的大小可在下一代GPU上运行，并可在VertexAI中的单个TPU主机上高效运行！）真的非常期待，大家将会用TA来构建什么！

101:03

我们将如何构建更安全的AI来造福人类和社会（研究被忽视的疾病、预测洪水等），将如何改进模型并防止其被滥用，包括AI-assisted Red Teaming 等技术的开发与应用。

105:48

LearnLM,一款基于Gemini并针对学习进行微调的新的系列模型，或将开启AI时代谷歌学习和教育的新篇章。LearnLM以教育研究为基础，试图让学习体验更加个性化、更加有趣！一款名为Learning Coach的预制Gems也即将在未来几个月上线。借助Learning Coach，你可以获得分步骤及全方位的学习指导。

107:24

Youtube将增加一项新功能，通过引入LearnLM,让教育视频（如：讲座、研讨会等）更具互动性！Youtube的这项功能已面向部分Android用户推出。

109:40

全场一共提到121次AI

"让我们一起创造未来的无数种可能性吧！"

“人工智能已经帮助人们从日常任务转向那些最雄心勃勃、最富成效和最有想象力的事业”

end

我们期待「未来知识社区 | 镭射山谷BEAM VALLEY」可以成为科技与泛领域爱好者知识分享和交流的平台，连接世界上有共同愿景的个人，旨在促进科技与泛领域的知识融合。因此，我们心潮澎湃的期待您的加入与共建。让我们共同维系知识的动态发展，保持知识的生动性，保护每一份宝贵的热情与好奇心，一起创造更大的价值吧！

山谷欢迎你

在看充电门

点赞充电门

发表评论