一、大公司动态
1、OpenAI 计划将 ChatGPT 打造成“超级智能个人工作助理”,与微软竞争?
https://www.theinformation.com/articles/openai-plans-chatgpt-personal-assistant-for-work-setting-up-microsoft-rivalry
OpenAI 首席执行官 Sam Altman 私下告诉投资者,计划将 ChatGPT 打造成“超级智能个人工作助理”,该助理可以根据个人风格和最新的商业信息,为用户草拟电子邮件或文档。
然而,该助理可能会与微软和 Salesforce 等客户发生利益冲突,其中微软还是 OpenAI 的主要合作伙伴、投资者和云服务提供商,它们也希望利用 OpenAI 的软件构建人工智能“副驾驶”(Copilots)来辅助工作。但根据 Altman 和另外两名知情人士透露,构建新的 ChatGPT 功能将成为 OpenAI 商业化努力的重点。
2、谷歌DeepMind CEO:下一代大模型将与AlphaGo合体
https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/
谷歌DeepMind CEO Hassabis近日对外媒Wired表示,Gemini还在开发中,还需要几个月,而谷歌DeepMind已经准备砸进数千万美元,甚至数亿。
据说,Gemini具有以前模型中没有的多模态功能,在集成工具和API方面非常高效。而且,Gemini将提供多种规模,旨在支持未来内存和规划上的创新。Gemini会将AlphaGo与GPT-4等大模型的语言功能合并,系统解决问题和规划的能力将大大增强,包括强化学习合和树搜索方法。强化学习允许AI通过从反复尝试和反馈中学习,解决挑战性难题;树搜索方法有助于探索和记住场景中可能的移动,比如在游戏场景中。
3、放眼生成式AI新机遇,2023亚马逊云科技召开中国峰会
https://36kr.com/p/2320003891479688
2023年6月27日,以“因构建 而可见”为主题的2023亚马逊云科技中国峰会在上海召开。在上午的主会场演讲环节,亚马逊全球副总裁、亚马逊云科技大中华区执行董事张文翊沿着“高瞻远瞩”、“放眼乾坤”、“未雨绸缪”的脉络,全面阐述了在当下这个挑战与机遇并存的时代,面对生成式AI等前沿科技带来的新挑战和新机遇。
企业需要“面向未来不断构建”,做到高瞻远瞩,积极拥抱技术革新,以具有创造性的方式想象未来的可能性,重塑企业及行业的未来;应放眼乾坤,瞄准全球用户,在一个更加广阔的天地里求变求发展;同时要做到未雨绸缪,夯实地基,打造业务韧性,为挑战和不确定性提前筹备。
4、Snowflake宣布与芯片巨头英伟达达成合作
https://techcrunch.com/2023/06/27/snowflake-nvidia-partnership-could-make-it-easier-to-build-generative-ai-applications/
Snowflake宣布与芯片巨头NVIDIA建立合作伙伴关系。根据合作协议,Snowflake的客户能够使用专有数据创建定制的生成式人工智能应用程序。以后在Snowflake平台上,各种规模的企业将能够定制高级人工智能大型语言模型,包括聊天机器人、搜索和分析工具。
Snowflake董事长兼首席执行官Frank slotman表示:「Snowflake与NVIDIA的合作将高性能机器学习和人工智能技术引入了我们丰富的专有和结构化企业数据,可为全球商业世界带来前所未有的洞察、预测能力和解决方案。」
NVIDIA创始人兼首席执行官黄仁勋表示:「数据对于创建能够理解每家公司复杂运营特点和独到之处的生成式人工智能应用程序至关重要。」「NVIDIA和Snowflake将共同创建一个人工智能工厂,帮助企业将自己的宝贵数据转化为定制化的生成式人工智能模型,从而为突破性的新应用提供动力,而且直接基于他们正在使用的业务云平台上。」
此外,Snowflake昨日(26日)还表示,公司扩大了与微软的合作伙伴关系,以集成跨人工智能新产品。此外,公司将增加Azure支出。
二、创业公司/新颖应用动态
1、AI解梦赋能精神疗愈,「Dreamore AI」打造梦境交流社区
近年来,“自我标签”成了Z世代的社交货币。“自我探寻”的庞大寻求已经催生了MBTI十六型人格测试、占星等具有广泛受众的市场,同时也哺育了解梦、艺术疗愈等利基市场。
不少研究证明,梦境能够反映人们日常被忽略的隐形压力、未被表达的内在情感以及潜在的心灵创伤,噩梦与疾病也存在一定的联系。自弗洛伊德所著《梦的解析》一书出版以来,梦境解析就成了心理治疗中的常规方法。美国精神疾病协会的一项研究显示,约28%的心理治疗会应用到解梦,解梦对约70.4%的病人具有治疗效果。
成立于2023年,Dreamore AI通过AI技术对用户梦境进行多流派的解释和描绘。通过在Web端和App端的对话框中输入对梦境的自然语言描述,Dreamore AI就可以基于“弗洛伊德”“周公”“湿婆”“现代科学”等梦境解析主流学派理论,对输入梦境进行解析,并生成梦境描述相关图片。
2、「魔鱼AI」推出服装AI设计工具
2023年,魔鱼AI成立,并在5月上线了服装AI设计工具「魔鱼GPT」。
在此之前,公司已于2021年年底和2022年9月分别推出了自研的供应链管理SaaS系统「魔鱼SCM」和制造执行SaaS系统「魔鱼MES」。同时,今年6月,魔鱼AI正式推出智能供应链平台「魔鱼服装B2B商城」,整合了魔鱼GPT设计工具,并与SCM、MES SaaS系统对接。
「魔鱼GPT」旨在面向设计师和服装企业提供创意设计、商品设计、素材设计、工艺设计和一键打板等服务。魔鱼GPT涵盖了公司基于大量服装数据和通用大模型(包括Midjourney、Stable Diffusion)训练调优后的行业多模态专属模型。不同模型分别满足流行元素抓取、素材设计、分品类的产品设计等不同需求。训练数据主要来自自有工厂和行业积累。
三、资本市场/A股市场动态
1、Databricks以13亿美元收购MosaicML
https://techcrunch.com/2023/06/26/databricks-picks-up-mosaicml-an-openai-competitor-for-1-3b/
Databricks宣布将斥资 13 亿美元收购 MosaicML。MosaicML是一家生成式AI服务提供商,聚焦于企业端的需求,其提供了一个平台,让各个企业都能够在安全环境中训练和部署AI模型,并且帮助企业降低AI系统的开销。MosaicML的产品组合主要包括开源的、商业授权的MPT Foundation系列模型和MosaicML 推理和训练服务,为企业提供了一系列的工具。在此之前,MosaicML 已从 DCVC、AME Cloud Ventures、Lux、Frontline、Atlas、Playground Global 和 Samsung Next 等投资者那里筹集了近 6400 万美元。
2、AI应用开发者平台「BentoML」获DCM领投900万美元种子轮融资,以Serverless云平台提供开箱即用的解决方案
36氪获悉,AI应用开发者平台「BentoML」已于日前完成900万美元种子轮融资,本轮融资由DCM领投,Bow Capital参投,融资金额将用于扩充产品体系和提升产品水平。
「BentoML」是一家专注于AI应用的开发者平台,成立于2019年,总部位于旧金山。核心团队主要由具有硅谷技术创业经历的工程师组成。「BentoML」致力于为开发者和企业客户提供构建、部署和扩展AI应用程序的能力,其开源产品已经支持全球范围内数千个企业及组织的核心AI应用,并受到了全球AI应用开发者的青睐。「BentoML」于近日发布其Serverless云平台BentoCloud,将更好的服务于全球AI开发者,进一步满足缩减开发时间和成本的刚性需求。
3、原粒半导体获数千万元种子轮融资
https://news.pedaily.cn/202306/516323.shtml
原粒半导体是一家创新AI Chiplet供应商,致力于成为国际领先的AI算力基础设施供应商。公司凭借多模态AI处理器设计技术和Chiplet设计方法学,为AI 2.0时代人工智能应用提供高性能、低成本、规格灵活的多模态大模型算力支撑。近日,原粒半导体完成数千万元种子轮融资,由英诺天使基金领投,中关村发展集团、清科创投、水木清华校友种子基金、中科创星等多家机构跟投。本轮融资将继续用于公司核心团队组建以及创新技术研发。
4、汤森路透将以6.5亿美元收购AI法律初创公司Casetext
https://techcrunch.com/2023/06/26/thomson-reuters-buys-casetext-an-ai-legal-tech-startup-for-650m-in-cash/
汤森路透(Thomson Reuters)日前宣布,已达成协议,以6.5亿美元收购为法律人士提供人工智能助理的法律初创公司Casetext,作为其在生成式AI方面长期投资的一部分。
Casetext是一家总部位于旧金山的初创公司,成立于2013年,拥有约100名员工。今年3月,该公司推出了法律人工智能助理CoCounsel。该产品是与OpenAI合作开发的,并在其最新版本的GPT大型语言模型上进行了培训,使用聊天机器人界面来帮助进行法律研究、文件审查和合同分析。
5、幂律联合智谱AI此次联合发布基于中文千亿大模型的法律垂直大模型——PowerLawGLM
PowerLawGLM法律大模型,基于智谱目前效果最好的ChatGLM 130B通用千亿对话大模型进行联合研发。在2022年11月斯坦福大学基础模型中心对全球 30 个大模型的评测结果中,GLM-130B 是亚洲唯一入选的Top10大模型。
1)训练法律垂直大模型第一步——基座层:阅读大量法律文本。
通用大模型在法律场景的应用效果问题,最基础的原因在于基座大模型没有经过大量高质量专业法律文本数据的训练。双方基于ChatGLM130B的基座大模型GLM 130B,经过了多轮多次高质量法律文本数据(裁判文书、法律法规、法律知识问答等)清洗及模型增量训练,得到法律版基座大模型LawGLM 130B。
2)训练法律垂直大模型第二步——对话层:与法律对话场景对齐,具备法律场景的对话能力。
LawGLM 130B基座模型具备了文本生成能力,但在法律对话能力上存在欠缺,因此需要利用大量的法律领域对话数据进行监督微调。双方利用了近百万对高质量法律知识问题数据,来训练得到PowerLawGLM beta版,此时,它已经初步具备了法律场景的端到端生成式对话能力以及独特的回答习惯。
3)训练法律垂直大模型第三步——应用层:保证输出结果质量和可靠性。
法律问答的很多场景都有其特殊性,对于结果准确性的要求、可解释性的要求较高,直接大模型来端到端生成回答,会面临很多效果问题,例如引用失效法律、杜撰法条案例、与法律人处理逻辑不一致等等。因此幂律设计了一系列通用型及场景特定型的工程化优化方案,来提升法律问答的有法可依和引用法条内容的准确性,最终提升法律问答的专业性和可靠性。
通过以上三层结构,在基座层、对话层、应用层上提升了大模型对法律专业文本的理解、推理与生成能力:
1
理解能力:理解复杂的法律文本,包括各种法律条款、判例、合同和其他法律文件。
2
推理能力:从法律文本中推断出潜在的问题,提供可能的解决方案,或者预测出可能的法律后果。
3
生成能力:回答法律问题,为用户提供咨询,甚至帮助起草法律文件。它还可以进行法律对话,帮助用户理解复杂的法律问题。
ChatGPT起草的合同较为简略,整体合同格式及条款表述与一份真实可用的合同差距较大,经常出现引用失效法律、条款缺失、信息不完备等问题;而PowerLawGLM将用户提问中的主体、标的物、单价、诉讼法院等信息准确无误的体现在合同正文中,并且合同条款的完整性、专业性差异显著。
4)基于PowerLawGLM大模型的能力,幂律打造了法律对话产品ChatMe,现已正式上线,首批开放50个内测名额。
ChatMe的功能和特点:
1
合同咨询:ChatMe拥有丰富的合同知识数据,能够回答诸如“合同租期期限”等合同知识问题。
2
合同起草:贴近中文合同起草场景,模版起草、条款组合起草、端对端生成起草等多种解决方案,让生成的合同质量更高。
3
合同信息抽取:能够识别合同中的关键信息进行提取,如主体信息,合同总金额等等。
4
合同审查:能够针对合同条款的风险点给出相关建议,提示风险。
5
通用法律咨询:提供具有专业法律依据的法律咨询服务。
四、拓展阅读
1、清华第二代60亿参数ChatGLM2开源,中文榜居首,推理提速42%
项目地址:https://github.com/THUDM/ChatGLM2-6B
HuggingFace:https://huggingface.co/THUDM/chatglm2-6b
ChatGLM-6B自3月发布以来,在AI社区爆火,GitHub上已斩获29.8k星。如今,ChatGLM-6B的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,又增加许多新特性:
更强大的性能:基于ChatGLM初代模型的开发经验,全面升级了ChatGLM2-6B的基座模型。ChatGLM2-6B使用了GLM的混合目标函数,经过了1.4T中英标识符的预训练与人类偏好对齐训练。评测结果显示,与初代模型相比,ChatGLM2-6B在MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。
更长的上下文:基于 FlashAttention 技术,研究人员将基座模型的上下文长度由 ChatGLM-6B 的2K扩展到了32K,并在对话阶段使用8K的上下文长度训练,允许更多轮次的对话。
更高效的推理:基于 Multi-Query Attention 技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用。在官方的模型实现下,推理速度相比初代提升了42%,INT4量化下,6G显存支持的对话长度由1K提升到了8K。
更开放的协议:ChatGLM2-6B权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。
在中文C-Eval榜单中,ChatGLM2以71.1分位居榜首,碾压GPT-4。而最新版本ChatGLM2-6B以51.7分位列第6
2、南京大学发布AvatarBooth:几张照片即可定制自己的3D化身,还能换装,3D模型的制作门槛被打下来了
论文链接:https://arxiv.org/pdf/2306.09864.pdf
项目链接:https://zeng-yifei.github.io/avatarbooth_page/
南京大学的研究人员推出AvatarBooth,可以根据文本提示或图像集合生成高质量和可定制的化身,能够准确反映特定个体的视觉和文字特征。该方法能够从任意捕获的面部或身体图像生成个性化头像,并且也支持基于文本的模型生成和编辑。
AvatarBooth学习了一个神经隐含表面来表示人类化身的形状和外观,分别由脸部和身体的预训练或微调的潜扩散模型来监督学习。并且在外观定制生成的任务中,文中提出了姿势一致的约束,以加强扩散模型的微调,可以提供了更准确的多视图监督,在姿势空间中具有一致的外观。此外,模型中还包括一个多分辨率的SDS方案,可以从粗到细地预测化身的精细结构和外观。只需要一个人的几张照片,模型就可以合成3D化身,不仅具有个性化独特的外观,而且还可以符合输入文本提示中指定的抽象特征,比如「戴眼镜」或「某种风格的帽子」等属性,用户可以很方便地编辑和修改化身的整体视觉形象。