《TensorFlow技术解析与实战》——1.6 机器学习的相关赛事

  • 时间:
  • 浏览:5

ILSVRC(ImageNet Large Scale Visual Recognition Challenge,大规模视觉识别挑战赛)是用来大规模评估对象检测和图像识别的算法的挑战赛。从2010年开使,至2016年已举办7届。ImageNet是目前世界上最大的图像识别数据库,拥有超过50万张有标记的高分辨率图像的数据集,那此图像分属于大约22 000个类别。ILSVRC使用ImageNet的一个 子集,分为1 000种类别,每段类别中不会 大约1 000张图像。总之,大约有140万 张训练图像,40万 张验证图像和40万 张测试图像。[13]图1-14所示为ImageNet的官方网站。

本身生活平台上一般会有或多或少穿衣搭配挑战、新浪微博互动预测、用户重复购买行为预测等赛事。平台提供的“赛题攻略”对新手入门有很大的引领作用。可能性在或多或少项目上取得不错的成绩,还有富有的奖金,以及进入阿里巴巴的工作可能性。

说到机器学习,不得不提到每年的或多或少挑战赛。近年来取得好成绩的队伍,常常时使用宽度学习的最好的方式的。正是那此赛事激励着全世界科学家不断采用更优化的最好的方式提高算法结果的准确率,也引领着年度的宽度学习探索方向。

值得自豪的是,在并且 过去的ILSVRC 2016上,中国学术界和工业界科研团队包揽了多项冠军[16]。

Kaggle本身生活比赛非常适合学生参加,可能性一般在校学生可能性拿只能并且数据。此外,Kaggle不仅对参赛者有算法能力上的要求,然可不后能 锻炼参赛者对数据的“嗅觉”,使参赛者从数据本身生活问题报告 报告 出发来寻求外理方案。

本节书摘来异步社区《TensorFlow技术解析与实战》一书中的第1章,第1.6节,作者:李嘉璇,更多章节内容都可不后能 访问云栖社区“异步社区”公众号查看。

在ImageNet上,习惯性地报告一个 错误率:Top-1和Top-5。Top-1错误率是指,预测输出的概率最高的类别,是算不算和人工标记的类别一致,可能性不一致,此时的概率。Top-5错误率是指,预测输出的概率最高的前一个类别当中,有没法和人工标记的类别一致,当一个不会 一致时的概率。之类在图片分类任务下,对一张图片进行预测,输出这张图片分类概率最高的一个类别,并且一个 预测的类别和人工标注的类别标记一致,并且认为正确。当一个不会 一致地处的概率并且Top-5错误率。

可能性说ILSVRC企业参加的居多,那Kaggle本身生活平台则更多地面向或多或少人开发者。图 1-16展示的是Kaggle的官方网站首页。

ILSVRC每年邀请谷歌、微软、百度等IT企业使用ImageNet,测试许多人许多人许多人都图片分类系统运行请况。过去几年中,该系统的图像识别功能大大提高,出错率仅为约5%(比人眼还低,人眼的识别错误率大约在5.1%[14])。在2015年,ILSVRC的错误率可能性降低到了3.57%[15],采用152层的ResNet获得了2015年分类任务的第一名。ILSVRC历年的Top-5错误率如图1-15所示。

“天池”是阿里搭建的一个 大数据竞赛平台,图1-17展示的是它的官方网站页面。

Kaggle成立于2010年,是一个 进行数据发掘、数据分析和预测竞赛的在线平台。与Kaggle相互合作并且 ,一家公司都可不后能 提供或多或少数据,进而提出一个 问题报告 报告 ,Kaggle网站上的计算机科学家和数学家(也并且现在的数据科学家)将领取任务,提供潜在的外理方案。最终胜出的外理方案都可不后能 获得3万美元到240万 美元的奖励。也并且说,Kaggle也是一个 众包理念,利用全世界的人才来外理一个 大问题报告 报告 。