上周,AI产业正在迅速发展,特别是在代码生成、搜索引擎和教育领域。Mistral AI的Codestral Mamba模型以其72亿参数和线性时间推理能力,引领代码生成技术。Shaped和Exa分别通过资本注入,加强了数据与AI模型的结合及AI搜索引擎的开发。OpenAI的4O Mini模型和Kyutai的Moshi模型展示了AI技术的高效和多模态能力。Eureka Labs和Groq的开源工具模型进一步推动了AI教育和工具使用的创新。同时,合规性成为焦点,OpenAI和欧盟都在加强AI技术的监管和安全。这些进展不仅加速了AI技术的应用,也确保了其在合规和安全的框架内发展。
1,AI产业及应用研究
Mistral AI 发布新模型 Codestral Mamba
[摘要]:Mistral AI 推出了新模型 Codestral Mamba,专注于代码生成,并以 Apache 2.0 许可证发布。该模型具备线性时间推理优势,可处理无限长度的序列,拥有 7,285,403,648 个参数,并在上下文检索能力方面经过大规模测试达 256k tokens。部署选项包括 mistral-inference SDK、TensorRT-LLM 和未来支持的 llama.cpp。原始权重可在 HuggingFace 下载。大版本 Codestral 22B 需商业或社区许可。
Shaped 筹集 800 万美元资本,提升企业数据与大语言模型结合能力
[摘要]:Shaped 筹集了 800 万美元的新资本,旨在简化企业将现有数据与大型语言模型和推荐系统结合的过程,以提供个性化用户体验。作为一个开发人员优先的平台,Shaped 为客户提供高度灵活性,允许选择数据源、集成方法、语言模型(如 Llama、CLIP、BERT)及推荐和搜索结果的评分机制。
Exa 筹集 1700 万美元打造 AI 搜索引擎
[摘要]:Exa 公司筹集了 1700 万美元新资本,由 Lightspeed、Nvidia 和 Y Combinator 领投,旨在开发一种 AI 原生搜索引擎,专为 AI 模型提供类似网络搜索的功能。该搜索引擎利用矢量数据库和嵌入技术,能够预测下一个链接而非单词。目前,Exa 的主要客户是 AI 公司,使用其搜索引擎查找信息和整理训练数据。
OpenAI 投资 Dot,Mem0 开源核心技术
[摘要]:Dot,这款连接生活点滴的 AI 应用,获得了 OpenAI 370 万美元投资。其背后的核心技术「超强个性记忆」由 Mem0 开源,目前已获得 9.5K Star。该技术特点包括多层次记忆(用户/会话、AI 代理记忆)、自适应个性化学习、跨平台兼容、API 友好,并支持私有化部署。
OpenAI发布4O Mini模型:更小巧高效的语言模型
[摘要]:OpenAI宣布推出新款4O Mini模型,该模型体积更小、效率更高。4O Mini在保持高性能的同时,优化了计算资源的使用,提供更快的响应速度和更低的计算成本。新模型旨在提升各种应用场景中的语言处理能力,推动人工智能技术的更广泛应用。
Mistral NeMo发布:优化大型语言模型部署与微调的全新框架
[摘要]:Mistral公司最新发布了Mistral NeMo框架,该框架旨在优化大型语言模型(LLM)的部署和微调。Mistral NeMo具备先进的功能,支持与多种工具和平台的集成,提供强大的模型微调选项,并通过先进的技术和优化手段提升模型性能。此框架为各类业务需求和应用场景提供了高效、可扩展的解决方案。
OpenAI发布4O Mini模型:更小巧高效的语言模型
[摘要]:OpenAI宣布推出新款4O Mini模型,该模型体积更小、效率更高。4O Mini在保持高性能的同时,优化了计算资源的使用,提供更快的响应速度和更低的计算成本。新模型旨在提升各种应用场景中的语言处理能力,推动人工智能技术的更广泛应用。
Kyutai 的 Moshi:挑战 GPT-4o 的开源模型
[摘要]:法国人工智能实验室 Kyutai 推出了 Moshi,这是一个开源的实时多模态模型,能够听、说、看,与 GPT-4o 相媲美。Moshi 的主要特点包括低于 300 毫秒的延迟、本地设备操作、以及法语口音的英语模仿功能。由八人团队在四个月内完成,Kyutai 计划很快发布相关论文和模型权重,展示了小型团队快速开发先进 AI 的潜力。
Andrej Karpathy 创办 Eureka Labs,推出 AI 教学助理
[摘要]:OpenAI 创始成员兼特斯拉前 AI 总监 Andrej Karpathy 正在创办一家名为 Eureka Labs 的 AI+教育公司。该公司将在其平台中整合 AI 教学助理,首款产品为本科水平的 AI 课程 LLM101。通过引入先进的人工智能技术,Eureka Labs 旨在提升教育质量和效率,为学生提供个性化的学习体验和辅助。
Groq发布两款开源工具模型
[摘要]:Groq发布了两款开源工具模型:Llama-3-Groq-70B-Tool-Use和Llama-3-Groq-8B-Tool-Use。这些模型在功能调用和工具使用任务上表现出色,其中70B模型在伯克利功能调用排行榜上名列前茅。它们使用完全微调和直接偏好优化进行训练,数据均为合伦理生成,无用户数据参与。模型现已在GroqCloud开发者中心和Hugging Face上提供。
谷歌利用人工智能加速代码迁移
[摘要]:谷歌利用生成式 AI 工作流程,加速了其代码迁移过程。过去,通过静态分析工具执行大规模代码变更,但在面对复杂结构代码时受限。新的 AI 工具将迁移过程分为三个阶段,重点在编辑生成和验证阶段。通过微调的 Gemini 模型,谷歌大幅减少了人工劳动和时间,成功实现了 75% 以上的 AI 生成代码变更。这一方法在复杂迁移任务上显示出巨大潜力,如数据类型迁移和系统架构调整。
Haiper推出Haiper 1.5
[摘要]:由前谷歌 Deepmind 研究人员创立的 AI 视频初创公司 Haiper 推出了 Haiper 1.5,这是一个新的视觉基础模型。该模型允许用户从文本、图像和视频提示中生成 8 秒长的片段。Haiper 1.5 通过结合先进的生成技术,提升了视频生成的质量和速度,为创作者提供了更多的创作可能性。
OpenAI推出新的企业合规API、管理工具和GPT控制
[摘要]:OpenAI推出了新的企业合规API、管理工具和GPT控制,以支持ChatGPT Enterprise客户的合规计划、数据安全和大规模用户访问。该套工具旨在增强企业对数据隐私和安全的管理能力,并简化合规流程,使企业能够更高效地利用生成式AI技术,同时确保符合相关法规要求。
NVIDIA 支持 AI 搜索引擎 Exa
[摘要]:人工智能研究初创公司 Exa 宣布已获得2200万美元的种子轮和A轮融资,资金来自 Lightspeed Venture Partners、NVIDIA 和 Y Combinator。Exa 将利用这笔资金构建专门针对人工智能的搜索引擎,借助大型语言模型 (LLM) 的强大功能,返回与搜索查询最相关的结果,而非仅返回最适合搜索引擎的文章。Exa 相信“人工智能将比人类更多地搜索网络”,因此需要比谷歌更强大的搜索引擎。
Anthropic 在 Amazon Bedrock 上为 Claude 3 Haiku 引入微调功能
[摘要]:Anthropic 在 Amazon Bedrock 上为 Claude 3 Haiku 引入了微调功能,允许企业针对特定任务定制模型。这一功能旨在提高模型性能,并增强企业对 AI 训练的控制,为满足多样化需求提供更大灵活性。
LLM 的分布式训练取得重大进展
[摘要]:P2P 去中心化模型训练可能成为解决模型算力缺口的重要方向。Prime Intellect 发布了支持全球范围 AI 模型分布式训练的框架 OpenDiLoCo。该框架基于 Google Deepmind 的 DiLoCo 方法,实验显示在三个国家之间训练模型时,计算资源利用率达90-95%,并将原始工作规模扩大三倍,证明其对十亿参数模型的有效性。OpenDiLoCo 的特点包括计算资源的动态调整、容错训练和无主节点的点对点架构,显著减少了通信时间,使全归约瓶颈仅占训练时间的 6.9%。
2,产品市场创新
Claude AI Android 应用发布
[摘要]:Anthropic 的 Claude AI 现已面向 Android 用户开放,提供多平台支持、视觉功能、多语言处理和高级推理能力。无论是起草提案、翻译菜单还是随时随地集思广益,Claude 都能为 Android 用户提供全面帮助。Anthropic 的这一举措确保其在 AI 助手市场中保持竞争力,不让任何移动用户落后。
Zoom 推出生成式 AI 驱动的工作流程自动化功能
[摘要]:Zoom 新推出了一项工作流程自动化功能,利用生成式 AI 帮助用户在 Zoom Workplace 和第三方应用程序(如 Jira 和 Google Drive)之间创建复杂的工作流程。此功能类似于 Zapier,旨在提高生产力。Zoom 提供的示例包括迎新员工、快速回答常见问题和跟踪流程批准。这些自动化工作流程将帮助用户更高效地管理和简化日常任务。
Google在 Workspace Labs 推出 Vids 生产力应用程序
[摘要]:Google 正在 Workspace Labs 中推出其新的 Vids 生产力应用程序。Vids 允许用户将文档、幻灯片、画外音和视频录制放入时间线,以创建可与同事共享的演示视频。这款应用程序旨在简化演示视频的制作流程,使用户能够更轻松地整合多种媒体内容,提升工作效率。
谷歌人工智能将改变奥运会
[摘要]:谷歌宣布与美国队和 NBCUniversal (NBCU) 建立合作伙伴关系,成为“美国队的官方 AI 赞助商”,并将在 2024 年巴黎奥运会期间整合其 AI 功能。NBCU 将利用谷歌地图展示场馆的 3D 视图,评论员将使用 Google AI Overviews 回答奥运相关问题,美国运动员将在社交媒体视频中使用多项谷歌技术探索巴黎。此次合作将利用谷歌技术增强赛事报道和观众体验
3,合规和监管
OpenAI推出新的企业合规API、管理工具和GPT控制
[摘要]:OpenAI推出了新的企业合规API、管理工具和GPT控制,以支持ChatGPT Enterprise客户的合规计划、数据安全和大规模用户访问。该套工具旨在增强企业对数据隐私和安全的管理能力,并简化合规流程,使企业能够更高效地利用生成式AI技术,同时确保符合相关法规要求。
欧盟发布《人工智能法案》最终全文
[摘要]:《欧盟人工智能法案》的最终全文已在欧盟官方公报上发布。该法案是欧盟针对人工智能应用制定的基于风险的监管法规。它为人工智能开发人员规定了不同的义务,具体取决于用例和感知风险。法案旨在确保人工智能技术的安全性和透明度,保护用户权益,并促进负责任的创新。
Meta将不向欧盟客户提供其下一代多模式AI模型
[摘要]:Meta宣布将不向欧盟客户提供其下一代多模式AI模型及未来的模型。这一决定是由于欧盟监管机构缺乏明确规定,导致合规挑战和不确定性。Meta表示,在欧盟政策环境更加明朗之前,公司将暂停在该地区的相关产品和服务。
美国领先科技公司组建人工智能安全联盟
[摘要]:谷歌、OpenAI、微软、亚马逊、Nvidia 和英特尔等顶尖科技公司共同成立了安全人工智能联盟 (CoSAI)。该联盟由 OASIS 主办,旨在通过开源方法、框架和工具增强 AI 系统的安全性和可靠性,解决 AI 安全领域的碎片化问题。主要目标包括开发 AI 安全最佳实践,处理模型盗窃、数据中毒等风险,并增强 AI 系统的软件供应链安全性。
微软用户需警惕:Copilot等AI工具可能未经授权截取个人数据
[摘要]:微软已警告用户,Copilot等AI工具可能在未获得明确同意的情况下截取个人数据的屏幕截图。这一隐私风险引发了严重的安全担忧,尤其是在AI工具日益融入日常数字互动的背景下。用户应保持警惕,定期检查和更新隐私设置,以确保个人信息得到有效保护。
谷歌——Gemini AI 被发现在未经用户许可的情况下扫描 Google Drive 文件
[摘要]:谷歌的 Gemini AI 被发现在未经用户明确许可的情况下扫描 Google Drive 文件,这引发了广泛的隐私担忧。用户担心他们的个人和敏感信息可能会被自动处理和分析,而没有给予同意。谷歌正在面对公众的质疑,需迅速采取措施解决此问题,并确保用户的数据隐私得到充分保