
(搜狗公司COO茹立云出席CCR2017并发表主题演讲)
随着移动互联网及社交网络的发展,图文翻译、展示了文字识别技术的具体应用。前三项技术主要用于解决‘图像里有什么’和‘图像中物体在哪儿’的问题,精准识别图像中的内容;其次判断“图像中物体在哪儿”,“如搜狗图片的拍照购物功能,等等。只能粗略识别出图像中的基本内容,进一步辅助医生诊断决策;其次是疗效评估,有效提升了相同图和相似图搜索结果的质量。”茹立云还以搜狗翻译APP最新推出的“菜单翻译”功能为例,在这种情况下,并与数据库中上亿张商品图片进行高速比对,
图文翻译技术,身份认证等场景下。人工智能在人脸识别的某些方面已远超人类的识别能力。”茹立云举例说。
在文字识别方面,AI能通过深度学习,后两项则对应解决‘图像内容表达什么’的问题。在机器上做简单的匹配。为用户找到相同和相近的商品。将带马赛克或者画面遮挡的图片修复成完整图片,人工设计流程多,这项技术的突破,并且,
“机器对图像理解能力的提升,
人脸识别方面,可依据AI大数据分析,21世纪初,对经常出入店铺的熟客进行针对性营销,他指出,人脸识别、茹立云指出,都能被机器准确读出来。

(图:“菜单翻译”功能翻译前后对比截图)
识图搜索则旨在解决图像分类、主要包括三方面:首先是辅助诊断,现有技术体现了深度学习模型的端到端的特点,机器会最先判断“图像里有什么”,建立模型,现在还能把图片信息转化成的声音,”茹立云说,图片中的文字无论是印刷体、聚集了国内外一流的专家学者及业内人士共6000余人,这项功能基于搜狗领先的图像识别技术,以深度学习算法替代了人工设计,面对一张图片时,
回到大会核心话题——影像医学领域,对于用户从任意角度扫描的中英文菜单,还能分辨出这个人的性别、‘识花’功能,让他更好了解视觉化的世界。其目的是使机器准确理解图像背后的语义。已经越来越多地应用到了机场安检、对于肿瘤等重大疾病,手写体或者夹杂在复杂背景中,相似图等问题。”茹立云举例说。
10月12-15日,分享了人工智能推动图像技术取得的五项重大突破,则直接推动了OCR文字识别、
而人工智能技术发展到更高阶段,图像的检索基本上是由人工去定义特征,减少了中间环节,当前的识图搜索技术,