0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

站长

2024年04月24日 08:58 · 阅读数 132

「行业动态」

◇ 《纽约时报》或将起诉 OpenAI ：新闻出版业与 AI 之争 🔗 Link

《纽约时报》正在考虑针对 OpenAI 提起诉讼，因为 ChatGPT 有可能与报纸的内容产生竞争，类似 Bing 和 Google 等基于人工智能的搜索引擎直接提供答案而非链接，从而减少了出版商网站的流量。尽管双方正在进行许可协议的谈判，但目前尚未达成一致，谈判陷入僵局。《纽约时报》目前正在考虑采取法律行动。这一事件可能会对人工智能领域产生深远影响，包括需要寻找新的训练数据、重新训练模型，以及部分减少网络上的实时搜索，可能会显著减缓人工智能技术的进步。

◇ 3D 魔术师：TADA 🔗 Twitter

文本到可动态数字化化身，通过仅使用文本描述作为输入，生成具有高质量几何和逼真纹理的富有表情的可动态 3D 化身，与 SMPL-X 完全兼容，这意味着它们可以被赋予动画效果，并融入现有的游戏引擎中。

paper: arxiv.org/abs/2308.10…

Github: github.com/TingtingLia…

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

◇ 科技公司急于推进大型语言模型开发， AI 芯片成为关键瓶颈 🔗 Twitter

科技公司急于开发自己的大型语言模型，为此它们需要硬件支持，其中一个硬件组件尤为重要：他们需要一款人工智能芯片，经过精心设计，这款芯片能够比传统的计算机芯片更高效地快速处理数据密集型任务。然而问题在于这款芯片现在已成为人工智能发展的主要瓶颈。AMD CEO 预测 AI 芯片市场将从今年的 300 亿美元飙升至 2027 年的 1500 亿美元。

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

◇ 警惕影子人工智能的出现 🔗 Twitter

生成式人工智能的广泛应用催生了影子 AI 问题，可能对网络安全、隐私和数据机密性造成威胁。影子 IT 和影子人工智能是未经批准使用或开发的代码和系统，可能绕过监管控制，带来数据泄露、法律责任等风险。解决之道包括明确政策、监管机制，鼓励负责任的 AI 思维，以及充分把握生成式人工智能发展的机遇，确保有效、负责任的使用。

◇ AI 医疗预测患者种族引发公平性问题 🔗 Twitter

斯坦福大学的医疗保健人工智能学者探讨了基于医学图像预测患者种族的 AI 能力影响，尽管人工智能在医疗保健中的应用广泛，但最近的研究表明，其模型可能会直接预测患者的种族，引发医疗保健不平等的关切。关于人工智能是否能够识别临床医生忽视的生物学差异，或者更可能基于其他特征进行推断，目前仍存在争议。种族在医疗保健中的问题复杂，种族是社会结构，没有生物学基础，遗传血统等因素更可能与医疗相关。许多人工智能模型是无法解释的“黑匣子”，其特征和信息对用户不透明。使用种族或代理进行诊断预测可能导致不足或过度诊断，加剧医疗保健不平等，然而 AI 可监控、评估、减少医疗差异，也能改善服务和结果。

◇ Abacus.AI 矢量匹配引擎打造 毫秒 级搜索体验 🔗 Twitter

Abacus.AI 的矢量匹配引擎是高效、准确搜索大量向量嵌入的解决方案，适用于语言、图像、推荐模型等应用领域，可扩展到数十亿个嵌入，拥有企业级更新速度和毫秒级延迟。支持各种最近邻算法，采用高效率技术，具备 100%的召回率。适用于广告定位、个性化、NLP 支持的图像分类等场景，同时它提供了企业级的安全性、治理、合规性和高可用性，能够处理大规模和高吞吐量的数据，实现在 150 毫秒内的高精度预测。

◇ 借助 Transformers x AutoGPTQ，让 LLMs 变得更快、更轻巧！ 🔗 Twitter

Hugging Face 集成了 AutoGPTQ 库，旨在通过 GPTQ 方法实现 LLMs 更轻量化，加快推理速度，节省内存，GPTQ 将模型权重量化为 int4，激活保持为 float16，在推理时动态解量化权重并在 float16 下执行计算。AutoGPTQ 在 Transformers 模型中原生支持 GPTQ，并可使用 Optimum 库进行量化和 PEFT 微调。TGI 库适用于生产环境中的文本生成推理。目前支持编码器/解码器架构的大型语言模型，如 Llama、OPT、GPT-Neo、GPT-NeoX。尽管 GPTQ 目前只针对权重量化，但仍在优化量化技术和内核实现方面有改进空间，并在探索大批量大小下的性能提升可能性。

◇ 德国计划投资近 16 亿欧元以缩小与中国、美国在人工智能方面的差距 🔗 Link

德国计划投资超过 16 亿欧元于人工智能领域，加强研究经费、建设实验室、扩展数据中心，推动透明、可靠的人工智能。未来两年内，德国将翻倍增加人工智能公共研究经费，达到近 10 亿欧元，以保持国际竞争力。该计划旨在促进经济成功和“欧洲制造”的人工智能，同时减少监管以吸引私人投资，预计德国的人工智能初创公司将翻倍增长。在“行动计划 AI”下，德国还将加大对人工智能研究、数据中心扩展和数据集提供的投入。

◇ Lemur-70B：最先进的多边形 LLM 战士，平衡了文本和代码能力 🔗 Twitter

Lemur 是最先进的开放式预训练大型语言模型，成功平衡了文本和代码的功能。与传统开放大语言模型不同，Lemur 和 Lemur-chat 不仅是最先进的预训练和监督微调模型，还在文本和代码智能方面均取得突出成果。通过在 Llama 2 上进行约 100B 的代码密集型数据预训练，并以约 300K 的教育和对话数据进行监督微调，Lemur 在各方面技能得到提升。

Model: huggingface.co/OpenLemur

blog: www.xlang.ai/blog/openle…

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

◇ 第一个商业可用的开源 LLM：Giraffe 🔗 Twitter 、 Link

首个商业可用的开源 LLM 发布，具备 32k 上下文大小，大多数开源模型一次只能处理约 1500 个单词左右，限制了实际应用的范围。从技术角度而言，这被称为模型的“上下文窗口”，以“标记”衡量，每个标记大约相当于 0.75 个单词。上下文窗口决定了模型在生成响应时能够考虑的单词数量，如果上下文窗口不够大，你无法要求模型处理一个 5000 个单词的 PDF 文档。这次发布的 Giraffe 项目将上下文从 2K 扩展到 32K，成为开源模型支持的最长上下文窗口。

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

◇ 一切皆可买卖的 AI 色情市场 🔗 Link

在 AI 色情市场，生成式人工智能工具让业余爱好者和企业家能够轻易制作大量未经同意的色情内容。CivitAI 是一个共享图像生成 AI 模型的网站，使用从互联网未经同意获取的真实人物图像进行训练，允许用户生成涉及性的图像。该平台上存在多种不同的模型，可以生成各种色情场景，但也受到部分用户的批评。这些平台的发展导致社区迅速增长，人们为了乐趣或利润推进这种实践，然而存在滥用问题，需要明确的道德准则和保护措施，以防止对个人隐私和社会底层人群的负面影响。

「融资快讯」

◇ 「Hugging Face」获得 2 亿美元 D 轮融资，或剑指超级独角兽 🔗 News

Hugging Face 近日完成了 2 亿美元的 D 轮融资，由 Salesforce Ventures 领投，公司估值达到 40 亿美元，其商业化表现良好，预计 2023 年 ARR 将约为 4000 万美元，超过 1.5 万家企业使用其产品，其中 3000 家为付费客户，包括英特尔、高通、辉瑞等知名品牌。公司推出了基于 300 亿参数的开源聊天机器人 HuggingChat 和用于 NLP 模型部署的 Inference API。自 2016 年成立以来，Hugging Face 发展迅速，已成为全球最大的 AI 开发者社区，分享了超过 21 万个训练模型和 3.8 万个数据集，涵盖多个领域。

「技术阅读」

◇ 生成对话：与 Jerry Liu 深入探讨 Llama 指数 🔗 YouTube

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

◇ 基于大语言模型的 AI Agents 🔗 Link 、 YouTube

AI Agent 能自主感知环境、采取行动实现目标，基于 LLM 的 AI Agent 运用记忆检索、决策推理和行动选择，提升智能水平。Agent 感知环境、自主行动并学习，决策流程包括感知、规划、行动，观察闭环学习，核心思想是 LLM 选择行动，Chains 中序列硬编码，LLM 推理引擎决定顺序，不同记忆类型用于决策，检索基于加权评分选择适宜记忆。Agent 还能抽象思考、生成反思储存，用于复杂推理和规划，通过递归生成细节创建计划，对话中使用记忆生成回应，持续对话至结束。

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

◇ 微调指南

OpenAI Fine-tuning 文档

GPT-3.5 和 LLaMA2 微调指南

「课程推荐」

◇ 吴恩达推出全新微课程《Finetuning Large Language Models 》 🔗 Twitter

了解微调大型语言模型（LLM）的基础知识。

了解微调与即时工程有何不同，以及何时使用两者。

获得真实数据集的实践经验，以及如何将技术用于自己的项目。

课程地址：www.deeplearning.ai/short-cours…

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

「招聘信息」

HC 曝光，简历投递可联系小助手（wx：wongmicky）

早早聊 AGI HC 文档：AGI 早早聊招聘内推坑位表
早早聊 AGI 招聘内推群，欢迎大家相互勾搭

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

「讲师招募」

2023 年 9 月 2 日，早早聊计划举办线上【前端搞构建】专场

📃 讲师报名，可联系早早聊负责人 Micky （wx：wongmicky）

🎙️ 可以聊聊：各类跨端、跨栈构建解决方案、构建的难点与挑战、Bundle 与 Bundleless 构建工具、本地/远程/上云构建方案、工程体积与构建性能、模块标准与模块规范、基于服务/浏览器的构建、分发等...

🎁 讲师福利，一次分享，即可享受：

永久免费与会前端早早聊大会
免费参与早早聊举办的酒蒙子局，认识更多技术人、创业人、AI 同行者
线上招聘，社区优先简历内推
还有更多等你来解锁...

转载自:https://juejin.cn/post/7270828786629853243

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争 、AI 芯片短缺成大型语言模型发展瓶颈...

「 行业动态 」

「 融资快讯 」

「 技术阅读 」

「 课程推荐」

「 招聘信息 」

「 讲师招募 」

0824 早早聊 AGI 资讯｜《纽约时报》或将起诉 OpenAI：新闻出版业与 AI 之争、AI 芯片短缺成大型语言模型发展瓶颈...

「行业动态」

「融资快讯」

「技术阅读」

「课程推荐」

「招聘信息」

「讲师招募」