取消

AI系列71:token是啥

Tokens（标记）是大语言模型（如 GPT、LLaMA、DeepSeek 等）处理文本的基本单位，它决定了模型如何“理解”和“生成”语言。以下是关于 tokens 的深度解析：一、Tokens 的本质定义 Token 是模型对文本进行分段处理的最小单元，可以是：一个单词（如 apple）一个子词（如 un + forget + able...

06-262025-06-26T05:30:00+08:00 5 分钟

AI系列70:AutoGPT

AutoGPT 是由开发者 Significant Gravitas 创建的开源 AI 代理项目，托管在 GitHub 上（项目地址）。它基于 GPT-4 或 GPT-3.5 大语言模型（LLM），通过自主任务分解与执行能力，实现了无需人工干预的复杂任务自动化。以下是核心调研结果： 🔧 一、技术栈与开发语言开发语言：Python（需 Python 3.8 及以上版本）。依...

06-252025-06-25T05:30:00+08:00 5 分钟

AI系列69:ComfyUI

ComfyUI 是一款开源的模块化 Stable Diffusion 工作流工具，通过节点式图形界面（Node-Based GUI）实现高度定制化的图像/视频生成流程。其核心定位是为专业用户提供精细化控制能力，同时兼顾性能优化与跨平台兼容性： 🧩 一、ComfyUI 核心特性与优势工作流自由定制基于节点拖拽连接构建生成流程（如加载模型→提示词编码→采样...

06-242025-06-24T05:30:00+08:00 5 分钟

AI系列68:suna，开源版manus

Kortix AI 是一家专注于通用型AI智能体（AI Agent）技术的新兴公司，成立于2024年，由 CEO Marko O. Kraemer 领导。公司定位为“通过自然语言交互解决现实世界复杂任务的AI助手开发者”，其核心产品是开源项目 Suna。 🧠 一、Kortix 公司背景成立时间：2024年技术方向：专注于开发具备“行动力”的AI Agent，支持自然语...

06-232025-06-23T05:30:00+08:00 5 分钟

AI系列67:Hugging Face 和 ModelScope魔搭

Hugging Face 和 ModelScope 是当前人工智能领域两大重要的开源模型平台，它们在推动模型共享、开发与应用方面扮演着关键角色，但在定位、技术生态和应用场景上存在显著差异： 🧠 一、核心定位与背景 | 特性 | Hugging Face | ModelScope ...

06-222025-06-22T05:30:00+08:00 6 分钟

AI系列66:LTX-Video

LTX-Video 是由以色列科技公司 Lightricks 开发的开源视频生成模型，是全球首个基于 DiT（Diffusion 扩散Transformer）架构的实时高质量视频生成模型。它通过创新的时空压缩技术和硬件优化，实现了 “生成速度快于视频播放速度” 的革命性突破。： 🧠 一、核心定位与技术突破实时高清视频生成支持 1216×704@30FP...

06-212025-06-21T05:30:00+08:00 7 分钟

AI系列65:Phi3与Phi Silica

Phi Silica 和 Phi-3 是微软推出的轻量级语言模型（SLM）系列中的不同成员，二者定位、架构和应用场景有显著差异。： 🧠 一、核心定位与设计目标 | 特性 | Phi-3 系列 | Phi Silica | |——————–|————————————|————————————...

06-202025-06-20T05:30:00+08:00 4 分钟

AI系列64:claude哪个模型最强

Claude Opus 4 是Anthropic目前最强大的模型，被官方称为“全球最佳编程模型”和“公司迄今最智能的AI系统”： ⚡️ 一、Claude Opus 4的核心优势编程能力全球领先在权威软件工程基准测试 SWE-bench 中达到 72.5% 的准确率，超越前代Opus及多数竞品（如GPT-4o）。实际开发中表现突出： ...

06-192025-06-19T05:30:00+08:00 5 分钟

AI系列63:AIPC NPU端侧大模型

AI PC 的 NPU（神经处理单元）上运行端侧大模型，能通过软硬件协同优化，实现高效能、低延迟的端侧 AI 体验： 🧠 一、轻量文本模型（专注语言任务） 1. Phi-3 Silica（微软）参数：3B 核心特性：专为 Copilot+ PC 设计，适配 NPU 算力，支持 128K 长上下文，推理延迟 <100ms。在端侧实...

06-182025-06-18T05:30:00+08:00 6 分钟

AI系列62:Gemma 3n

Gemma 3 和 Gemma 3n 是 Google DeepMind 在 2025 年推出的两代开源大模型，定位互补但技术架构与应用场景差异显著： 🧠 一、Gemma 3：高性能通用多模态模型 1. 核心定位与特性开源多模态基座：支持文本、图像、短视频输入，具备跨模态推理能力（如图像问答、视频摘要）。参数规模：提供 1B/4B/12B/27B 四档参数版本，均支持 1...

06-172025-06-17T05:30:00+08:00 5 分钟

1
2
3
...
36
1 / 36

热门标签