AI及信息技术应用2024年7月21日简报-AI商业周刊

上周，AI产业正在迅速发展，特别是在代码生成、搜索引擎和教育领域。Mistral AI的Codestral Mamba模型以其72亿参数和线性时间推理能力，引领代码生成技术。Shaped和Exa分别通过资本注入，加强了数据与AI模型的结合及AI搜索引擎的开发。OpenAI的4O Mini模型和Kyutai的Moshi模型展示了AI技术的高效和多模态能力。Eureka Labs和Groq的开源工具模型进一步推动了AI教育和工具使用的创新。同时，合规性成为焦点，OpenAI和欧盟都在加强AI技术的监管和安全。这些进展不仅加速了AI技术的应用，也确保了其在合规和安全的框架内发展。

1，AI产业及应用研究

Mistral AI 发布新模型 Codestral Mamba

[摘要]：Mistral AI 推出了新模型 Codestral Mamba，专注于代码生成，并以 Apache 2.0 许可证发布。该模型具备线性时间推理优势，可处理无限长度的序列，拥有 7,285,403,648 个参数，并在上下文检索能力方面经过大规模测试达 256k tokens。部署选项包括 mistral-inference SDK、TensorRT-LLM 和未来支持的 llama.cpp。原始权重可在 HuggingFace 下载。大版本 Codestral 22B 需商业或社区许可。

Shaped 筹集 800 万美元资本，提升企业数据与大语言模型结合能力

[摘要]：Shaped 筹集了 800 万美元的新资本，旨在简化企业将现有数据与大型语言模型和推荐系统结合的过程，以提供个性化用户体验。作为一个开发人员优先的平台，Shaped 为客户提供高度灵活性，允许选择数据源、集成方法、语言模型（如 Llama、CLIP、BERT）及推荐和搜索结果的评分机制。

Exa 筹集 1700 万美元打造 AI 搜索引擎

[摘要]：Exa 公司筹集了 1700 万美元新资本，由 Lightspeed、Nvidia 和 Y Combinator 领投，旨在开发一种 AI 原生搜索引擎，专为 AI 模型提供类似网络搜索的功能。该搜索引擎利用矢量数据库和嵌入技术，能够预测下一个链接而非单词。目前，Exa 的主要客户是 AI 公司，使用其搜索引擎查找信息和整理训练数据。

OpenAI 投资 Dot，Mem0 开源核心技术

[摘要]：Dot，这款连接生活点滴的 AI 应用，获得了 OpenAI 370 万美元投资。其背后的核心技术「超强个性记忆」由 Mem0 开源，目前已获得 9.5K Star。该技术特点包括多层次记忆（用户/会话、AI 代理记忆）、自适应个性化学习、跨平台兼容、API 友好，并支持私有化部署。

OpenAI发布4O Mini模型：更小巧高效的语言模型

[摘要]：OpenAI宣布推出新款4O Mini模型，该模型体积更小、效率更高。4O Mini在保持高性能的同时，优化了计算资源的使用，提供更快的响应速度和更低的计算成本。新模型旨在提升各种应用场景中的语言处理能力，推动人工智能技术的更广泛应用。

Mistral NeMo发布：优化大型语言模型部署与微调的全新框架

[摘要]：Mistral公司最新发布了Mistral NeMo框架，该框架旨在优化大型语言模型（LLM）的部署和微调。Mistral NeMo具备先进的功能，支持与多种工具和平台的集成，提供强大的模型微调选项，并通过先进的技术和优化手段提升模型性能。此框架为各类业务需求和应用场景提供了高效、可扩展的解决方案。

OpenAI发布4O Mini模型：更小巧高效的语言模型

Kyutai 的 Moshi：挑战 GPT-4o 的开源模型

[摘要]：法国人工智能实验室 Kyutai 推出了 Moshi，这是一个开源的实时多模态模型，能够听、说、看，与 GPT-4o 相媲美。Moshi 的主要特点包括低于 300 毫秒的延迟、本地设备操作、以及法语口音的英语模仿功能。由八人团队在四个月内完成，Kyutai 计划很快发布相关论文和模型权重，展示了小型团队快速开发先进 AI 的潜力。

Andrej Karpathy 创办 Eureka Labs，推出 AI 教学助理

[摘要]：OpenAI 创始成员兼特斯拉前 AI 总监 Andrej Karpathy 正在创办一家名为 Eureka Labs 的 AI+教育公司。该公司将在其平台中整合 AI 教学助理，首款产品为本科水平的 AI 课程 LLM101。通过引入先进的人工智能技术，Eureka Labs 旨在提升教育质量和效率，为学生提供个性化的学习体验和辅助。

Groq发布两款开源工具模型

[摘要]：Groq发布了两款开源工具模型：Llama-3-Groq-70B-Tool-Use和Llama-3-Groq-8B-Tool-Use。这些模型在功能调用和工具使用任务上表现出色，其中70B模型在伯克利功能调用排行榜上名列前茅。它们使用完全微调和直接偏好优化进行训练，数据均为合伦理生成，无用户数据参与。模型现已在GroqCloud开发者中心和Hugging Face上提供。

谷歌利用人工智能加速代码迁移

[摘要]：谷歌利用生成式 AI 工作流程，加速了其代码迁移过程。过去，通过静态分析工具执行大规模代码变更，但在面对复杂结构代码时受限。新的 AI 工具将迁移过程分为三个阶段，重点在编辑生成和验证阶段。通过微调的 Gemini 模型，谷歌大幅减少了人工劳动和时间，成功实现了 75% 以上的 AI 生成代码变更。这一方法在复杂迁移任务上显示出巨大潜力，如数据类型迁移和系统架构调整。

Haiper推出Haiper 1.5

[摘要]：由前谷歌 Deepmind 研究人员创立的 AI 视频初创公司 Haiper 推出了 Haiper 1.5，这是一个新的视觉基础模型。该模型允许用户从文本、图像和视频提示中生成 8 秒长的片段。Haiper 1.5 通过结合先进的生成技术，提升了视频生成的质量和速度，为创作者提供了更多的创作可能性。

OpenAI推出新的企业合规API、管理工具和GPT控制

[摘要]：OpenAI推出了新的企业合规API、管理工具和GPT控制，以支持ChatGPT Enterprise客户的合规计划、数据安全和大规模用户访问。该套工具旨在增强企业对数据隐私和安全的管理能力，并简化合规流程，使企业能够更高效地利用生成式AI技术，同时确保符合相关法规要求。

NVIDIA 支持 AI 搜索引擎 Exa

[摘要]：人工智能研究初创公司 Exa 宣布已获得2200万美元的种子轮和A轮融资，资金来自 Lightspeed Venture Partners、NVIDIA 和 Y Combinator。Exa 将利用这笔资金构建专门针对人工智能的搜索引擎，借助大型语言模型 (LLM) 的强大功能，返回与搜索查询最相关的结果，而非仅返回最适合搜索引擎的文章。Exa 相信“人工智能将比人类更多地搜索网络”，因此需要比谷歌更强大的搜索引擎。

Anthropic 在 Amazon Bedrock 上为 Claude 3 Haiku 引入微调功能

[摘要]：Anthropic 在 Amazon Bedrock 上为 Claude 3 Haiku 引入了微调功能，允许企业针对特定任务定制模型。这一功能旨在提高模型性能，并增强企业对 AI 训练的控制，为满足多样化需求提供更大灵活性。

LLM 的分布式训练取得重大进展

[摘要]：P2P 去中心化模型训练可能成为解决模型算力缺口的重要方向。Prime Intellect 发布了支持全球范围 AI 模型分布式训练的框架 OpenDiLoCo。该框架基于 Google Deepmind 的 DiLoCo 方法，实验显示在三个国家之间训练模型时，计算资源利用率达90-95%，并将原始工作规模扩大三倍，证明其对十亿参数模型的有效性。OpenDiLoCo 的特点包括计算资源的动态调整、容错训练和无主节点的点对点架构，显著减少了通信时间，使全归约瓶颈仅占训练时间的 6.9%。

2，产品市场创新

Claude AI Android 应用发布

[摘要]：Anthropic 的 Claude AI 现已面向 Android 用户开放，提供多平台支持、视觉功能、多语言处理和高级推理能力。无论是起草提案、翻译菜单还是随时随地集思广益，Claude 都能为 Android 用户提供全面帮助。Anthropic 的这一举措确保其在 AI 助手市场中保持竞争力，不让任何移动用户落后。

Zoom 推出生成式 AI 驱动的工作流程自动化功能

[摘要]：Zoom 新推出了一项工作流程自动化功能，利用生成式 AI 帮助用户在 Zoom Workplace 和第三方应用程序（如 Jira 和 Google Drive）之间创建复杂的工作流程。此功能类似于 Zapier，旨在提高生产力。Zoom 提供的示例包括迎新员工、快速回答常见问题和跟踪流程批准。这些自动化工作流程将帮助用户更高效地管理和简化日常任务。

Google在 Workspace Labs 推出 Vids 生产力应用程序

[摘要]：Google 正在 Workspace Labs 中推出其新的 Vids 生产力应用程序。Vids 允许用户将文档、幻灯片、画外音和视频录制放入时间线，以创建可与同事共享的演示视频。这款应用程序旨在简化演示视频的制作流程，使用户能够更轻松地整合多种媒体内容，提升工作效率。

谷歌人工智能将改变奥运会

[摘要]：谷歌宣布与美国队和 NBCUniversal (NBCU) 建立合作伙伴关系，成为“美国队的官方 AI 赞助商”，并将在 2024 年巴黎奥运会期间整合其 AI 功能。NBCU 将利用谷歌地图展示场馆的 3D 视图，评论员将使用 Google AI Overviews 回答奥运相关问题，美国运动员将在社交媒体视频中使用多项谷歌技术探索巴黎。此次合作将利用谷歌技术增强赛事报道和观众体验

3，合规和监管

OpenAI推出新的企业合规API、管理工具和GPT控制

欧盟发布《人工智能法案》最终全文

[摘要]：《欧盟人工智能法案》的最终全文已在欧盟官方公报上发布。该法案是欧盟针对人工智能应用制定的基于风险的监管法规。它为人工智能开发人员规定了不同的义务，具体取决于用例和感知风险。法案旨在确保人工智能技术的安全性和透明度，保护用户权益，并促进负责任的创新。

Meta将不向欧盟客户提供其下一代多模式AI模型

[摘要]：Meta宣布将不向欧盟客户提供其下一代多模式AI模型及未来的模型。这一决定是由于欧盟监管机构缺乏明确规定，导致合规挑战和不确定性。Meta表示，在欧盟政策环境更加明朗之前，公司将暂停在该地区的相关产品和服务。

美国领先科技公司组建人工智能安全联盟

[摘要]：谷歌、OpenAI、微软、亚马逊、Nvidia 和英特尔等顶尖科技公司共同成立了安全人工智能联盟 (CoSAI)。该联盟由 OASIS 主办，旨在通过开源方法、框架和工具增强 AI 系统的安全性和可靠性，解决 AI 安全领域的碎片化问题。主要目标包括开发 AI 安全最佳实践，处理模型盗窃、数据中毒等风险，并增强 AI 系统的软件供应链安全性。

微软用户需警惕：Copilot等AI工具可能未经授权截取个人数据

[摘要]：微软已警告用户，Copilot等AI工具可能在未获得明确同意的情况下截取个人数据的屏幕截图。这一隐私风险引发了严重的安全担忧，尤其是在AI工具日益融入日常数字互动的背景下。用户应保持警惕，定期检查和更新隐私设置，以确保个人信息得到有效保护。

谷歌——Gemini AI 被发现在未经用户许可的情况下扫描 Google Drive 文件

[摘要]：谷歌的 Gemini AI 被发现在未经用户明确许可的情况下扫描 Google Drive 文件，这引发了广泛的隐私担忧。用户担心他们的个人和敏感信息可能会被自动处理和分析，而没有给予同意。谷歌正在面对公众的质疑，需迅速采取措施解决此问题，并确保用户的数据隐私得到充分保