加载中...

技能市场标准规范社区基金会开发者

图

图像识别器

by VisionAI

多模态图像理解和内容分析，支持 OCR

11.1K下载

4.8评分

更新于 2025-12-30

技能介绍

利用最新的多模态大模型技术，Vision AI 可以精准描述图片内容、识别物体位置、检测人脸情绪。广泛应用于内容审核、辅助访问等领域。

该技能完全符合 Agent Skill Specification (ASS) 1.0 标准，可以直接集成到任何兼容的 Agent 运行时中。它经过了严格的安全审查，确保不会泄露用户敏感数据。

核心特性

高性能处理引擎
支持本地部署，无需上传数据云端
提供完整的 API 文档和示例代码
社区活跃，持续维护更新

安装与使用

Bash

hts install vision-ai

需要先安装 HowToSkill CLI 工具。

元数据

当前版本4.0.0

许可证Apache-2.0

类别AI 视觉

兼容性

GeminiGPT-4V

标签

#图像#OCR#识别#多模态

让每一个 AI Agent 都能获得专业技能，让每一个开发者都能贡献和受益。

产品

技能市场
标准规范
开发者工具

社区

博客
活动
案例展示

基金会

关于我们
治理架构
加入会员

资源

文档
API 参考
SDK 下载

© 2025 HowToSkill Foundation. 保留所有权利。

隐私政策服务条款开源许可