深度学习

了解更多

语音技术

了解更多

人脸技术

了解更多

图像技术

了解更多

自然语言

了解更多

深度学习

大数据模型搭建

通过客户的现有知识库搭建属于客户自己的私有化大语言模型。

机器视觉

卷积神经网络可以识别图像中的主要对象,并输出分类结果。

自然语言理解

利用LSTM网络从IMDB电影评论的中分析出评论者情绪的正面和负面。

语音技术

语音识别

通过场景识别优化,为车载导航、智能家居和社交聊天等行业提供语音解决方案,准确率达到90%以上。

长语音识别

长语音识别服务可快速准确的将长时间的语音转化为文字,方便进行拷贝和编辑等后续工作。

远场语音识别

通过麦克风阵列前端处理算法,有效消除噪音,对说话声音进行增强,使智能家居、智能硬件、机器人语音交互等场景下的远场语音也可准确识别。

语音合成

基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求。

语音唤醒

通过在设备或软件中预置唤醒词,当用户发出该语音指令时,设备便从休眠状态中被唤醒,并作出指定响应,大大提升人机交互的效率。

人脸技术

人脸检测

快速检测人脸并返回人脸框位置、定位五官与轮廓关键点。准确识别多种人脸属性。

人脸对比

两张人脸进行1:1比对,得到人脸相似度,支持生活照、证件照、身份证芯片照、带网纹照、红外黑白照5种图片类型的人脸对比。

人脸查找

根据待识别人脸与现有人脸库中的人脸匹配程度,返回用户信息和匹配度,即1:N人脸检索。

图像技术

文字识别

多种场景下精准的图像文字识别技术服务,包括:通用文字识别、卡证识别、网络图片文字识别、表格文字识别。

图像审核

基于深度学习的智能内容审核方案,准确识别图片和视频中的涉黄、涉暴涉恐、政治敏感、微商广告、恶心等内容。

图像识别

基于深度学习及大规模图像训练,准确识别图片中的物体类别、位置、置信度等综合信息。应用范围包括:图像主体检测、通用物体识别等内容。

自然语言技术

语言处理基础技术

词法分析、依存句法分析、词向量表示、语言模型、词义相似度等。

理解与交互技术

对话理解和对话管理技术、引入语音和知识建设能力,为企业和个人开发者轻松定制专业、可控、稳定的对话系统提供全方位技术与服务。

语言翻译

通用翻译/定制化翻译/拍照翻译