会员登录|免费注册|忘记密码|管理入口 返回主站||保存桌面
乌鸦AI日报:OpenAI已重启机器人团队两个月,Suno3.5版本模型已向所有人开放
2024-12-21IP属地 湖北3

  OpenAI发言人证实,该公司已在两个月前重启四年前解散的机器人团队,并表示最近新招聘的员工将成为“这个全新团队的首批成员之一”。

  Suno官方宣布,Suno最新3.5版本模型已经向所有人开放,这个版本可以制作4分钟的歌曲。

  过去一天,国内外AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。

  / 01 /

  1)前快手副总裁薛苏加入百度,担任副总裁、AI创新业务负责人

  在百度移动生态万象大会中,新任百度副总裁、AI创新业务(原NewAPP)薛苏出席。据悉,薛苏同时负责MEG投资部门。

  薛苏,原快手副总裁,2020年加入快手,毕业于清华大学自动化系,在耶鲁大学取得博士学位,研究方向为计算机视觉与图形学。

  2)快手上线自研文生图大模型产品“可图”

  快手自研的文生图大模型“可图”正式对外开放,这款大模型支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。

  3)南京:到2026年人工智能核心产业规模要超600亿

  南京市政府发布并解读了《南京市进一步促进人工智能创新发展行动计划》,计划到2026年引培基础大模型1个、行业大模型20个,以上,可统筹智能算力超6000P FLOPS,每年打造30个标杆应用场景,实现人工智能核心产业规模600亿元。

  4)Opera与谷歌云合作,浏览器AI助手Aira接入Gemini大模型

  昆仑万维旗下海外信息分发与元宇宙平台Opera宣布将谷歌Gemini大模型整合到其原生浏览器AI助手Aria中,Aria将集成免费的图像生成能力,由Vertex AI Imagen 2模型驱动。

  5)光年之外联创曹越再创业,零一万物副总裁加盟

  前微软亚洲研究院研究员、智源研究员、光年之外联创曹越已于近期创业。曹越,清华大学博士学位,2021年获得ICCV最佳论文奖,其发表论文的谷歌引用量接近4万次,主要研究方向为视频基础模型。

  曹越的新公司还包括两位重量级人物,前零一万物副总裁黄文灏和前微软研究院视觉组主管研究员张拯。

  6)百度发布AI原生应用“橙篇”,文库AI用户数超1.4亿

  百度发布综合性AI原生应用“橙篇”,该应用基于百度文库12亿内容和1.4亿用户行为数据反馈。用户可以进行大量、多格式、长内容的文件理解、总结和问答,能进行长篇幅的长文生成、编辑和多模态创作。

  / 02 /

  海外动态

  1)OpenAI已重新启动之前被放弃的机器人团队

  OpenAI发言人证实,该公司已重启四年前解散的机器人团队,并表示最近新招聘的员工将成为“这个全新团队的首批成员之一”。知情人士表示,新机器人团队已经初步形成,并已经运作约两个月。

  2)Suno3.5版本模型已向所有人开放,可制作4分钟歌曲

  据Suno官方消息,Suno的最新3.5版本模型已经向所有人开放,这个版本的改进包括:可以制作4分钟的歌曲,创建最长2分钟的歌曲扩展,以及显著改进的歌曲结构。

  2)OpenAI推出大学教育版本ChatGPT Edu,数据将不用于训练模型

  OpenAI宣布推出为大学而设计的ChatGPT Edu,向学生、教职员工、研究人员和校园运营部署人工智能。搭载GPT-4o,ChatGPT Edu可以跨文本和视觉进行推理,使用先进工具如数据分析。这一新产品包括企业级安全性和控制,价格适中,适合教育机构使用。

  3)苹果或将允许Siri控制APP所有功能,此前已与OpenAI达成合作

  科技界资深分析师爆料,苹果公司正筹划利用大型语言模型来让用户能够首次通过Siri控制应用程序中的所有功能。此前报道,OpenAI和苹果的交易已经完成,业界猜测交易价值达数十亿美元。

  4)Mistral AI发布编程大模型Codestral:支持Python等80种语言

  法国AI初创公司Mistral AI发布专为编程而设计的大语言模型(LLM)Codestral。Codestral熟练使用80多种编程语言;参数只有220亿的Codestral,上下文长度达到3.2万个tokens。

  5)慕尼黑工业大学等提出全新算法NPGA,可生成超逼真3D化身

  谷歌Gemini大模型快速迭代,性能显著提升,已逼近OpenAI的GPT-4o。在综合测试中,Gemini 1.5 Pro/Advanced排名第二,轻量版Gemini 1.5 flash排名第九。Gemini的中文能力尤其突出,已超越GPT-4o。

  7)美国军方向Palantir拨款4.8亿美元,推动AI技术军用

  美国国防部最近向数据处理公司Palantir拨款4.8亿美元,旨在加速将其Maven AI战斗代码引入整个国防部,国防部希望在2029年前完成这项工作。

  9)CoPE论文爆火:所有大模型都能获得巨大改进

  来自MetaAI部门的论文迅速在AI领域爆火,该研究提出了一种新的用于transformer的位置编码方法CoPE,解决了标准transformer无法解决的计数和复制任务,有望解决如今大模型最让人头疼的问题。

  10)Cohere最新开源Aya-23:支持23种语言,8B/35B可选

  加拿大独角兽AI公司Cohere开源了8B和35B的多语言模型Aya23,其中Aya-23-35B在所有评估任务和涵盖的语言中取得了最好成绩。覆盖23种语言,分别为阿拉伯语、中文(简体和繁体)、捷克语等。