作者:Norman Niemer 翻译:李润嘉 校对:李洁 本文约2000字,建议阅读10分钟。 本文为资深数据科学家常见的10个错误提供解决方案。 数据科学家是“比软件工程师更擅长统计学,比统计学家更擅长软件工程的…
标签:数据科学
50款大数据分析神器 :你还在用Excel
你平时用什么大数据分析工具? D3? R? 还是Processing? PS和计算器… 只有你还在用excel! 工欲善其事,必先利其器! 一款好的工具可以让你事半功倍。 大数据时代,需要工具实现数据可视化…
实用 :机器学习解释模型:黑盒VS白盒(附资料链接)
作者:Lars Hulstaert;翻译:吴金笛;校对:Nicola 本文约2000字,建议阅读9分钟。 本文将讨论一些可用于解释机器学习模型的不同技术。 大多数机器学习系统需要能够为利益相关者解释为何做出这样特定…
一文读懂神经网络(附解读&案例)
作者:Matthew Stewart;翻译:车前子;校对:陈丹 本文约5500字,建议阅读12分钟。 本文的知识将提供一个强有力的基础,带你入门神经网络的性能,应用于深度学习应用。 “你的大脑并不产生思想。你的思想塑造了…
关于产品、数据和人,这里有 8 条经验「收藏」
选自towardsdatascience;作者:Daniel Shenfeld;机器之心编译;参与:李诗萌、路 关于产品、数据和人,这里有 8 条经验。 这是一篇经验帖,作者 Daniel Shenfeld 曾在 12 …
学Excel,一辈子这门课就够了
你是否真的“精通Excel”? – excel水平自检表 – 每个人的简历上,都有一句“精通Excel”, 而根据经验,大多数人,功力一般在一二层之间。 至于心法高处,用Excel打游戏或…
测量、建议、快速上手!你所使用的Python对象占用了多少内存?(附代码)
作者:Gigi Sayfan 翻译:吴振东 校对:吴金笛 本文约3300字,建议阅读10分钟。 本文将介绍多种Python对象分别所占用的内存,并解释所选择的测量方法和函数,为节省内存提供建议。 Python是一种很棒…
谷歌发布NLP最先进预训练模型:开源BERT
作者:Jacob Devlin and Ming-Wei Chang, Research Scientists, Google AI Language;翻译:佟海宁;校对:吴金笛 本文约2000字,建议阅读9分钟。 本文…
推荐 :如何改善你的训练数据集?(附案例)
作者:Pete Warden;翻译:申利彬; 本文约6800字,建议阅读10分钟。 本文作者基于自身项目经验阐述训练数据的重要性并分享了一些改进的实用技巧。 Lisha Li 摄 这张幻灯片是Andrej Karpath…
这里有8个流行的Python可视化工具包,你喜欢哪个?
选自Medium 作者:Aaron Frederick 机器之心编译 参与:李诗萌、王淑婷 喜欢用 Python 做项目的小伙伴不免会遇到这种情况:做图表时,用哪种好看又实用的可视化工具包呢?之前文章里出现过漂亮的图表时…