5月30日,第三期百度大脑开放日在深圳举行,开放日当天,百度大脑全新发布了四大平台、两大场景方案并升级了九个AI开放能力。
据了解,百度大脑此次在AI开发平台方面共发布了4个平台,分别为EasyDL定制视频分类平台、智能视频监控开发平台、一站式内容审核平台以及iOCR财会版。
其中,EasyDL再次得到更新,在之前图像分类、物体检测、声音分类、文本分类的基础上,又新增了定制视频分类功能,面向视频分析场景,通过标注每类50个、10秒左右的短视频片段进行训练,从而实现“需要连续图片帧组合判断”的视频内容分析;全流程可视化界面操作,只需4步,最快1个小时即可获取API服务;并且每个分类,只需50-100条视频片段,模型精度可达95%以上。
另外,EasyDL视频分类还即将推出一系列工具组件,支持端到端业务。据悉,截至目前,已有近1.5万企业客户在EasyDL上创建了超过3万个模型。
在视频监控领域,虽然百度大脑开放了一系列的模型和能力,但从AI模型到业务平台的开发成本依然很高,包括摄像头对接与管理、视频流的处理、前端业务系统、模型调用与业务逻辑处理等复杂的工作。
针对此问题,百度大脑全新发布了智能视频监控开发平台,这是一个可以零开发成本快速搭建多路视频智能监控系统的平台,不仅预置了工业、教育、园区安防等9个场景经过实际项目验证的检测技能,同时还提供一套完整可用的客户端管理系统组件,实现了摄像头管理、人脸库配置功能,部署完成即可直接使用。
在内容审核领域,百度大脑全新推出的全面、实时、易用的内容审核平台,它可以支持图片、文本、语音等多种媒体内容,并内置广告检测、质量检测、暴恐识别等20多个维度的审核模型。同时,该平台有很高的灵活性,可以支持自定义黑白库、支持自由配置审核规则。同时,平台预置了海量的图像/文本黑库,并紧跟热点实时更新,帮助平台提升内容质量。通过全方位审核能力、灵活的策略配置、实时的策略迭代。
值得关注的是,会上,百度大脑还发布了iOCR财会版,该平台具备票据检测与智能裁剪、票据自动分类、多种预置票据识别模板、场景化高精度自定义模板能力等核心功能,其中平台内置7种报销用票据、四大行&招行的银行回单和对账单识别模版,预计可满足80%以上企业财税报销场景的票据识别需求。iOCR财会版可有效解决金融财税场景下的对OCR的特殊需求。
据悉,iOCR是国内首个自定义模板文字识别平台,自2017年12月上线以来,目前已有将近2万个企业客户在iOCR平台上创建了近4万个识别模板,在多个行业场景中落地应用,助力企业办公实现自动化。
此次开放日,两项全新场景方案也首次亮相:呼叫中心语音场景方案和虚拟真人助理解决方案。
其中,呼叫中心语音场景方案包括呼叫中心场景专属语音识别模型和语音合成专属音库;适配MRCP标准协议,与对话系统深入配合,灵活支持打断等需求;全双工流式交互,提供低延迟、高并发的企业级语音服务。
虚拟真人助理解决方案,可广泛应用于虚拟主播、智能客服、趣味互动视频等场景。
特别声明:
转载上述内容请注明出处并加链接。上述内容仅代表作者或发布者的观点,与中国电子商会官网的立场无关。如有任何疑问或了解更多,请与我们联系。电话:4008 900 668 邮箱:service@cecc.org.cn