
据外媒9to5Mac昨日报道,苹果公司在Hugging Face平台推出了FastVLM视觉语言模型的浏览器试用版。该模型以“闪电般”的视频字幕生成速度著称,仅需搭载Apple Silicon芯片的Mac设备即可体验。其核心优势在于卓越的效率:通过苹果自研的MLX框架优化,模型体积仅为同类产品的三分之一,但生成速度提升85倍。
实测显示,在16GB M2 Pro MacBook Pro上,首次加载需数分钟,但启动后可精准识别画面中的人物、环境及物体。值得注意的是,所有数据均在设备端处理,无需上传云端,充分保障用户隐私。这种本地运行特性还使其在可穿戴设备和辅助技术领域潜力巨大,例如为虚拟摄像头提供实时场景描述。
原创文章,作者:Apple,如若转载,请注明出处:https://www.kejixun.co/article/732705.html