首页
艺搜天下---纯净互联网,让每一个页面都有价值!
取消

AI系列63:AIPC NPU端侧大模型

AI PC 的 NPU(神经处理单元)上运行端侧大模型,能通过软硬件协同优化,实现高效能、低延迟的端侧 AI 体验: 🧠 一、 轻量文本模型(专注语言任务) 1. Phi-3 Silica(微软) 参数:3B 核心特性: 专为 Copilot+ PC 设计,适配 NPU 算力,支持 128K 长上下文,推理延迟 <100ms。 在端侧实...

AI系列62:Gemma 3n

Gemma 3 和 Gemma 3n 是 Google DeepMind 在 2025 年推出的两代开源大模型,定位互补但技术架构与应用场景差异显著: 🧠 一、Gemma 3:高性能通用多模态模型 1. 核心定位与特性 开源多模态基座:支持文本、图像、短视频输入,具备跨模态推理能力(如图像问答、视频摘要)。 参数规模:提供 1B/4B/12B/27B 四档参数版本,均支持 1...

AI系列61:minicpm

效果很惊艳:https://m.youtube.com/watch?v=JFJg9KZ_iZk MiniCPM 系列是由中国人工智能公司 面壁智能(OpenBMB) 研发的高效端侧大模型家族,专注于在低资源设备(如手机、平板)实现高性能多模态能力。以下是三款模型的详细解析与技术对比: 🧠 一、模型概览与核心定位 | 模型 | 发布时间 | 核心定位 ...

AI系列60:Perplexity

Perplexity AI 是一家专注于 对话式搜索引擎(Answer Engine) 的创新型人工智能公司,成立于 2022 年,总部位于美国旧金山。它通过融合实时网络检索与大语言模型(LLM)能力,直接为用户提供精准、可验证的答案,而非传统搜索引擎的链接列表。其核心定位是“让知识获取像对话一样自然”,目前月查询量超 7.8 亿次,被英伟达创始人黄仁勋称为“几乎每天使用”的工具。 🔍...

AI系列59:ElevenLabs

前面刚写了12 labs,这里又来了一个11 labs, ElevenLabs 是一家专注于生成式AI语音技术的创新公司,成立于2022年。其核心目标是通过AI模型消除语言障碍,提供高度逼真的语音合成、克隆及多语言配音服务,已成为估值超11亿美元的独角兽企业: AI语音技术先驱,致力于创造最自然,最富表现力的AI语音解决方案。 🧠 一、核心技术与功能 自然语音合成(TTS) ...

AI系列58:TwelveLabs视频理解

TwelveLabs(Twelve Labs Inc.)是一家专注于多模态视频理解技术的创新型人工智能公司,总部位于美国旧金山,创立于2021年。其核心目标是通过自研的AI模型,使机器能够像人类一样深度理解视频内容,实现“让视频的处理和搜索变得和文本一样容易”: 🧠 一、核心定位与技术优势 视频优先(Video-First)策略 TwelveLabs 并非将视频视为图像或音频的简...

AI系列57:Cherry Studio

Cherry Studio 是一款功能强大的开源跨平台多模型AI桌面客户端,支持 Windows、macOS 和 Linux 系统。它集成了多种主流大语言模型(如 OpenAI、Gemini、Anthropic、DeepSeek 等)以及本地模型(通过 Ollama),允许用户自由切换云端或本地模型,同时支持多模型对话对比、文件管理、知识库构建、AI绘画、翻译等功能。其核心亮点包括:内置 3...

AI系列56:LangChain

LangChain 是一个用于构建基于大语言模型(LLM)应用的开源框架,由 Harrison Chase 于 2022 年创建。其核心目标是通过模块化设计简化 LLM 与外部工具、数据源和工作流的集成,支持开发者构建复杂任务链(如文档处理→分析→报告生成)、Agent 动态决策等场景。 是一个专为简化大语言模型(LLM)应用开发而设计的开源框架,旨在帮助开发者高效构建基于大模型的智能应用...

AI系列55:海鲜市场

哈哈,就是闲鱼

AI系列54:minimax

大模型初创公司 覆盖文本,语音,视觉三大模态 旗下模型有 abab 6.5 speech-02 hailuo 02视频生成模型 旗下还有agent产品