AI - 网站分类 - 博客园

0

Open R1 项目进展第一期

DeepSeek R1 发布已经两周了，而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊: Open-R1 在模仿 DeepSeek-R1 流程和数据方面的进展我们对 DeepSeek-R1 的认识和相关讨论 DeepSeek-R1 发布后社 ...

HuggingFace 发布于 2025-03-29 06:42 评论(0) 阅读(5)

0

Midscene与Qwen-VL模式小试UI自动化

背景Midscene.js是一款由字节跳动Web Infra团队开发的开源、基于AI技术的UI自动化工具，其应用场景广泛且多样：1. 自动化测试功能测试：Midscene.js能够模拟用户操作，如点击按钮、输入文本等，对Web应用进行功能测试，确保应用在不同情况下都能稳定运行。冒烟测试：对于简单的站 ...

PetterLiu 发布于 2025-03-28 22:03 评论(0) 阅读(7)

0

万字长文详解Text-to-SQL

什么是Text-to-SQL 在各个企业数据量暴涨的现在，Text-to-SQL越来越重要了，所以今天就来聊聊Text-to-SQL。 Text-to-SQL是一种将自然语言查询转换为数据库查询的技术。它可以让用户通过自然语言来查询数据库，而不需要编写复杂的SQL语句。 Text-to-SQL的应用 ...

boydfd 发布于 2025-03-28 17:11 评论(0) 阅读(168)

0

AI开发系列一：概念扫盲

大模型演变与概念人工智能人工智能是一个非常广泛的领域，涵盖了多种技术和方法，包括但不限于机器学习、自然语言处理、计算机视觉、专家系统、机器人学等。人工智能旨在创建能够模拟人类智能行为的系统或软件。它包括感知、推理、学习、决策和语言理解等多种能力，目标是让计算机能够像人类一样思考和行动。在人工 ...

DOONDO 发布于 2025-03-28 01:07 评论(0) 阅读(29)

0

【AI News | 20250327】每日AI进展

AI Repos 1、playwright-mcp 使用Playwright提供浏览器自动化功能的MCP服务，核心是让LLM通过结构化的可访问性快照与网页交互，不需要依赖截图或视觉模型。可以用来自动填写网页表单、自动收集网页信息、自动进行网页测试等。支持两种模式：快照模式（默认）：使用可访问性快照； ...

卷胡发布于 2025-03-27 23:06 评论(0) 阅读(11)

0

让 LLM 既能“看”又能“推理”！

DeepSeek-R1 会推理，GPT-4o 会看。能否让 1 LLM既能看又能推理？ DeepSeek-R1取得很大成功，但它有个问题——无法处理图像输入。 1.1 DeepSeek模型发展自2024.12，DeepSeek已发布： DeepSeek-V3（2024.12）：视觉语言模型（VLM ...

公众号-JavaEdge 发布于 2025-03-27 22:08 评论(0) 阅读(10)

0

Function Calling 执行流程和历史消息结构

在 function calling（工具调用）的场景中，传递给大语言模型（LLM）的历史消息需要包含完整的对话上下文，包括用户输入、模型生成的工具调用请求（tool_calls），以及工具执行后的返回结果。以下是详细的格式说明和示例：核心流程与消息结构用户提问 → 2. 模型生成工具调用请求 ...

拓荒者IT 发布于 2025-03-27 20:20 评论(0) 阅读(15)

0

为什么 AI 模型离科学革命还差得很远？

作者：Thomas Wolf, Hugging Face 联合创始人和首席科学家发布日期：2025 年 2 月 26 日原文链接： The Einstein AI model 几天前，我在一个活动上分享了一个略显争议的观点，后来我决定把它写下来：我担心人工智能无法带来所谓的“压缩的 21 世 ...

HuggingFace 发布于 2025-03-27 19:22 评论(0) 阅读(24)

3

常见的 AI 模型格式

来源：博客链接过去两年，开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布，并被用于实际应用中。然而，开发者在使用这些模型时面临的一个挑战是模型格式的多样性。在本文中，我们将探讨当下常见的 AI 模型格式，包括： GGUF PyTorc ...

HuggingFace 发布于 2025-03-27 17:40 评论(1) 阅读(291)

0

AI穿上身：苹果手表如何改变你的生活？

楔子：一个普通理工男的科技启示录我是张三，一个标准的90后理工男。在这个日新月异的科技时代，我习惯用精密的逻辑和近乎机械的效率来审视世界。每天早上6点45分准时起床，每一分钟都被精确地规划，生活就像一台运转良好的精密仪器。然而，就在今年3月的某个平凡日子，一则关于苹果AI智能手表的新闻，彻底颠覆了 ...

一面千人发布于 2025-03-27 15:33 评论(0) 阅读(48)

0

vue3-webseek网页版AI问答|Vite6+DeepSeek+Arco流式ai聊天打字效果

2025 AI实战vue3+deepseek+arcoDesign仿DeepSeek/豆包网页版AI聊天助手。 vue3-web-deepseek 实战网页PC版智能AI对话，基于vite6+vue3.5+openAI对接DeepSeek-Chat聊天对话模型。实现流动式打字返回效果、支持亮色+暗黑 ...

xiaoyan2017 发布于 2025-03-27 13:09 评论(0) 阅读(155)

3

（踩坑）windows本地部署Dify ，玩转智能体、知识库

windows 安装docker windows 本地部署deepseek windows 通过docker本地部署dify 一：安装Docker 前提：开启Hyper-V 打开控制面板 - 程序 - 启动或关闭windows功能在对话框中分别选中打开：开启WSL2 打开cmd 运行 wsl ...

周捷Jay 发布于 2025-03-27 09:41 评论(0) 阅读(374)

0

《DeepSeek原理与项目实战》 | PDF免费下载

DeepSeek 是一种基于 Transformer 架构的生成式 AI（Artificial Intelligence）大模型，融合了MoE 架构、混合精度训练、分布式优化等先进技术，具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型 DeepSeek-V3 的核心技术及... ...

天涯倦客的美丽人生发布于 2025-03-27 00:07 评论(0) 阅读(45)

0

cs231n-图像分类：kNN与线性分类器

声明：根据ppt以及子豪哥的讲解，同时含有自己的一些理解，逐渐构成的该部分文章。若有哪里有问题，欢迎各位积极提出宝贵的意见，谢谢大家。十分感谢cs231n的课程老师以及b站up主：同济子豪兄 1.概述图像分类，物体检测。宗旨： 2.图像分类：kNN与线性分类器图像分类：只要检查出对应物体的类 ...

虾饺爱下棋发布于 2025-03-26 22:04 评论(0) 阅读(12)

0

OpenAI的GPT-4o：普通人的AI秘书来了

1. 惊艳时刻：AI比你想象的更"人性" 早餐时，张三正埋头刷推送，一篇关于OpenAI发布GPT-4o的文章瞬间点燃了他的好奇心。这个AI简直是科技圈的惊雷！竟然可以像真人一样说话、理解语境、实时交互，甚至能读懂你的情绪。这哪里还是以前那个机械的聊天机器人，简直就是随时待命的智能秘书。 2. 黑科 ...

一面千人发布于 2025-03-26 20:25 评论(0) 阅读(31)

0

基于Python程序访问本地部署的DeepSeek和硅基流动DeepSeek API

前排提醒： 1. 本地通过Ollama部署DeepSeek，部署版本为 deepseek-r1:1.5b，若还未进行本地部署，可以参考博客Windows系统上使用Ollama本地部署DeepSeek 2. 线上API使用的是硅基流动（siliconflow）的DeepSeek API，模型名称为 d ...

叶疏鸿发布于 2025-03-26 14:05 评论(0) 阅读(31)

0

在HTML页面通过JavaScript访问DeepSeek-R1（使用硅基流动Api）

前排提醒： 1. 操作系统为Windows11 2. DeepSeek使用的是硅基流动（siliconflow）的API，模型名称为 deepseek-ai/DeepSeek-R1 第一步：在硅基流动官网的API密钥菜单（ https://cloud.siliconflow.cn/account/ ...

叶疏鸿发布于 2025-03-26 11:04 评论(0) 阅读(22)

0

Ollama系列06：C#使用OllamaSharp集成Ollama服务

本文是Ollama系列教程的第6篇，主要介绍如何通过SDK将ollama集成到c#程序中。 Ollama系列教程目录（持续更新中）：轻松3步本地部署deepseek 快速上手搭建私有的AI对话框和智能体—chatbox版快速上手搭建私有的AI对话框和智能体—cherryStudio版进阶篇-搭 ...

拓荒者IT 发布于 2025-03-25 21:47 评论(0) 阅读(28)

0

在HTML页面通过JavaScript访问Ollama本地部署的DeepSeek

在HTML页面通过JavaScript访问Ollama本地部署的DeepSeek，顺便解决了 HTML 页面调用 Ollama 服务的跨域问题 ...

叶疏鸿发布于 2025-03-25 21:14 评论(0) 阅读(16)

0

【调研】Vision Language Model Safety

Adversarial Attacks White-box Attacks Task-specific Attacks 的目标是针对某个具体的任务（如图像描述生成、指代表达理解等），通过精心设计的对抗样本，使得模型在该任务上产生错误的输出。例如，攻击者可能希望模型生成错误的图像描述，或者在对图像进行 ...

ZeroZeroSeven 发布于 2025-03-25 18:44 评论(0) 阅读(94)