超级公开课第17讲 | 开源软件平台RAPIDS如何加速数据科学

超级公开课第17讲 | 开源软件平台RAPIDS如何加速数据科学

时间:2018年12月27日 08:00
地点:智东西公开课小程序
人数:1000
活动内容
大数据分析流程大致分为数据准备、数据合并、数据降维等。在数据准备阶段,数据科学家需要先下载数据,然后还要进行数据抽取、数据转换、数据加载等,而且一般情况下数据包都非常大,所以数据科学家大部分时间是在等待数据准备好,因此有人戏称,数据科学家不是在喝咖啡就是在去喝咖啡的路上。随着数据量越来越大,数据科学家处理数据所需时间也越来越长,导致工作效率非常低。
 
在今年nvidia.zhidx.com/tag/gtc.html" target="_blank" style="color:#01afec;">gtc europe大会上,nvidia发布了一款针对数据科学和机器学习gpu加速平台rapids,该平台构建于apache arrow、pandas和sklearn等组件之上,通过cudf数据过滤、cuml机器学习、cugraph数据图像化来加速处理数据,为数据科学家提供标准化的流水线式工具,数据处理速度较仅用cpu提升50倍,大大提高了数据科学家的工作效率。
 
12月27日晚8点,超级公开课nvidia专场第17讲将开讲,由nvidia解决方案架构师孙鹏主讲,主题为《开源软件平台rapids如何加速数据科学》。
 
主讲嘉宾:
孙鹏,nvidia解决方案架构师,中国科学院大连化学物理研究所物理化学博士。博士期间从事分子反应动力学理论研究,负责组内gpu程序开发,参与国内rapids首批用户测试工作。
 
 
课程大纲:
1、数据科学面临的挑战
2、开源软件平台rapids架构解读
3、rapids安装及使用方法
4、xgboost算法简介
5、rapids应用案例分享
 
点击课程回放,登录之后即可听课。
订阅英伟达 NVIDIA 技术月刊
输入电子邮件,订阅 NVIDIA 加速计算或深度学习电子月刊
订阅