2022-07-28
Kaggle 大数据竞赛
美国知名大学认可,更有含金量 / 培训和锻炼学生的效率意识和全局规划意识 /对于未来想从事计算机相关工作的人有很大的提升作用
Kaggle 大数据竞赛
一 . 比赛简介
Kaggle 创立于 2010 年,是全球最大的数据科学社区和数据科学竞赛平台,2017 年被 Google 收购。Kaggle 以数据挖掘起家,为了快速高效的解决最棘手的问题,该平台发布了众多数据科学、机器学习相关的竞赛。Kaggle 的多数竞赛由企业或者研究机构发布,以竞赛奖励的方式向全球征集解决方案,通过众包的方式解决建模问题,诸如 Google、Facebook、Microsoft 等知名科技公司均在 Kaggle 上举办过数据挖掘比赛。对参赛者来说,他们不仅有机会接触丰富的真实数据,解决实际问题,角逐名次,赢取奖金。每年,Kaggle 官方还会举办一次大规模的竞赛,奖金高达一百万。Kaggle 一直致力于解决业界难题,不以学历和工作经验作为唯一的人才评判标准,而是着眼于个人技能,为顶尖人才和公司之间搭建了一座桥梁。Kaggle 竞赛平台:只要你有才,只要你能解决问题,全球顶尖高校 offer 和顶级互联网公司入职加薪均有可能。
二 . 比赛规则
1. 比赛语言:英文
2. 比赛时间:全年滚动发布,具体可参照官网信息
3. 参赛资格
对数据科学、数据挖掘、机器学习感兴趣的高中生
有一定计算机背景的大学生
4. 竞赛类型
乍看之下,Kaggle 竞赛的参与门槛极高,但其实,Kaggle对初学者也是十分友好的,从 Kaggle 提供的官方分类来看,其难度从初学到高阶以及求职均有涉及。最常见的竞赛可以划分为以下类型:
Featured:Kaggle 最著名的比赛类型,适合数据科学高手参与。题目都是全面的机器学习问题,难度较高,通常是商业或科研难题,奖金池最大
Research:科研和学术性较强的比赛,同样适合数据科学高手参与,以实验研究为主要方向的竞赛,一般需要较强的领域和专业知识,奖金相比 Featured 较少
Getting Started:适合基础入门选手,与 Featured 竞赛结构类似,但没有奖金,以初学者项目学习积攒经验为主
Recruitment:适合想要去发布公司求职的人,以各大公司需要招募相关职业为主,比赛的奖励为面试机会
Playground:提供一些公开的数据集用于尝试模型和算法
Masters:大师级别的比赛,难度最高,项目也最少
Annual: 有 两 种 类 型 的 年 度 比 赛:March MachineLearning Competition, 自 2014 年 以 来, 该 比 赛 每年都在美国大学篮球锦标赛期间举行;Santa-themedOptimization Competition,每年在圣诞节前后举行一次
5. 竞赛流程
a. 注册账号(一人只能有一个账号)
b. 选择想要参赛的项目
c. 下载题目的数据(rain 数据集,用来优化模型;test 数据集,用来测试优化好的模)test 的结果就是要提交的结果,提交之后就代表正式参赛,会在网上显示排名(每天可多次提交)
d. 直到时间截止,评出最优者
e. 获奖的队伍必须提交源代码(队伍之间不能私自分享代码或者数据)
注:可以以个人或组队的形式参加比赛,在参赛时可以相互分享经验。
6. 竞赛要求
编程语言:最基础的入门学者也需要学会初步使用一门编程语言。对于毫无基础的新手,推荐使用 Python,因为Python 作为一种强大的胶水语言,可迅速入门
探索数据:光有编程语言是不够的,还需要学习如何探索性分析你手上的数据,这是进入数据科学的第一步。因为通常到手的数据都多到不可思议,你要学会取舍和迅速获取最有用的信息
模型训练:熟悉使用机器学习库,培养良好的习惯,为之后的工作做铺垫实战,从初级可以逐渐增加难度
三 . 奖项设置
Kaggle 奖牌赛只有前 10% 的队伍才有可能拿到最后的奖牌
前 10% 可以拿到铜牌
前 5% 可以拿到银牌
前 20 名可以拿到金牌
前 3 名有奖金
上述就是为大家分享的“【国际竞赛-计算机类】Kaggle 大数据竞赛”,希望可以帮助到大家。想要了解更多国际竞赛信息以及国际竞赛辅导班课,点击本网站在线咨询输入关键词即可获得详细了解。