图
图像识别器
by VisionAI
多模态图像理解和内容分析,支持 OCR
11.1K下载
4.8评分
更新于 2025-12-30
技能介绍
利用最新的多模态大模型技术,Vision AI 可以精准描述图片内容、识别物体位置、检测人脸情绪。广泛应用于内容审核、辅助访问等领域。
该技能完全符合 Agent Skill Specification (ASS) 1.0 标准,可以直接集成到任何兼容的 Agent 运行时中。它经过了严格的安全审查,确保不会泄露用户敏感数据。
核心特性
- 高性能处理引擎
- 支持本地部署,无需上传数据云端
- 提供完整的 API 文档和示例代码
- 社区活跃,持续维护更新
安装与使用
Bash
hts install vision-ai需要先安装 HowToSkill CLI 工具。
元数据
当前版本4.0.0
许可证Apache-2.0
类别AI 视觉
兼容性
GeminiGPT-4V
标签
#图像#OCR#识别#多模态