AI亿览通入口
400-700-8700
  • AI新零售

    AI新基建

    工业互联网
    消费品零售方案
    智慧城市
    地产科技

    AI新资管

    保险标的物AI监管
    动产抵押AI监管

 

计算机视觉正在加速行业中几乎每个领域的发展。在计算机视觉技术的帮助下,组织正在彻底改变机器以前的工作方式。在AI模型搭建时,为了建立强大的计算机视觉深度学习模型,获得更高的准确率,必须在训练阶段应用高质量的数据集。

AI技术的落地实践与应用越来越方便,随着各种强大的数据集发布,机器学习模型训练无需再亲自采集数据,数据训练集唾手可得。拥有强大的零售商品识别能力的品览,近期正式发布RP2K零售数据集。

 

不同于一般聚焦新产品的数据集,RP2K收录了超过50万张零售商品货架图片,商品种类超过2000种,该数据集是目前零售类数据集中产品种类数量TOP1,同时所有图片均来自于真实场景下的人工采集,针对每种商品,我们提供了十分详细的注释。RP2K致力于帮助物品识别领域进行学术研究,同时为AI物品识别从业者打造真实行业级试炼场。

 

RP2K的独特之处

 

(1)就产品类别而言,毫无疑问,它是迄今为止全球规模最大的零售数据集,超过2000种SKU。
 
(2)所有图像均在自然采光的实体零售店中手动采集,与实际应用场景匹配度极高,具有极佳的实践落地适应性。
 
(3)品览为每种商品提供了丰富的注释,包括大小、形状和味道/气味。期待RP2K数据集可以为计算机视觉领域研究和零售行业AI落地赋能。

 

 

RP2K的分类

 

2000多种SKU、50万张图片

 

 

商品识别的难点

 

在真实场景中,准确识别货架上零售产品仍然具有很高的挑战性。难点如下:
 
(a)同一生产线中的产品可能具有不同的尺寸,并且它们通常外观高度相似但价格不同。图像尺寸无法反映产品的实际尺寸。
 
(b)制造商通常会为一条产品线制造多种口味,但是它们的外观在标签上只有非常细微的差别。
 
(c)执行人员在拍摄货架图片时,由于相机角度、拍摄环境不同,图片会产生变形,图像也可能被拉伸,甚至会出现曝光不足的现象。
 
从下面的样例图可以看到,RP2K针对以上可能的情况均有涉及,采用细粒度识别对商品进行甄别。

 

RP2K种类丰富,训练出来的准确性高适用范围广,更接近实用需求,而不是完全实验室场景下采集的数据集,因此更有说服力。
 
欢迎访问品览官网进行下载,或点击阅读原文,获取链接!
 

注意:该数据集和代码包仅可免费用于学术用途。您需要自行承担运行风险。出于其他目的,请联系品览作者彭靖田(pjt@pinlandata.com)
 
  

品览Pinlan是AI物品识别专家,我们的产品结合了AI的认知识别能力,Cloud的强劲算力,IoT的边缘支持。我们的使命是让物品识别能力无处不在,赋能星球上的每一个企业与个体。

在AI应用领域,团队服务过欣和集团、上汽集团、顶新集团(味全)、Farfetch、自如、英德知、河南中烟等客户。我们同全球顶级合作伙伴微软,企业微信,百度AI大脑等一起为企业客户提供AI巡店通,AI亿览通,小览机器人以及品识-AI商品识别平台产品服务。

 扫一扫添加品览微信号

了解更多品览动态

 

微信扫一扫
关注该公众号

品览发布开源数据集:全球SKU种类最多的零售数据集RP2K

2020-08-07