数据科学的重要支柱统计学的最佳入门书

全文共字,预计学习时长4分钟

图源:unsplash

数据科学领域颇具魅力,有很多人跃跃欲试想要涉足其中,但却因为一些门槛而迟迟不敢迈出脚步。其中最重要的一个就是统计学,包括描述统计学、推论统计学以及概率论。

理工类大学已经有了许多统计学课程,为什么我还要写这篇文章呢?主要原因有三,本文适用于:

·已有统计学学习背景,但搁置较久的人

·在学习过程中感到迷茫不解的人

·痴迷统计学的人

如果你符合以上任意一种,那这篇文章就有你所需。我在本科毕业后开始研读此书,录取为数据科学研究生后不久将它读完。我很庆幸自己读了这本书,它让我少走了很多弯路。

《深入浅出统计学》(HeadFirstStatistics)

它不同于大学授课常采用的教材,有着丰富的图解和简单明了的说明,不像大学教材则充斥着公式、证明以及老掉牙的文本。这本书很厚,有多页,第一次看到实体书可能会感到焦虑,但其实阅读起来压力不大,且听我细细道来。

任意一本统计学和概率论的大学教材大多在页左右,甚至更多。虽然比《深入浅出统计学》薄很多,但却鲜有图例、图解。如果删除《深入浅出统计学》中所有图解,全书就只剩不到一半了。

图解为何重要?大多数人不喜欢阅读一页页老生常谈的文本。尤其是那些忙碌一天后,利用下班时间学习统计学的人。让他们读完全是文字的统计学书是不可能的,三段之内必然熟睡。

人们需要的是适量的文本,附加精良的图解及实用的示例。

图源:unsplash

如果一篇文章没有分隔,一段通篇,你还会读吗?不会,因为这样的一篇文章就是无故平添的负担。同时,人的注意广度也比较短,如果一段文字不能在30秒内读完,读者大概率会放弃继续阅读。换言之,读者更愿意阅读排版相对美观舒服的文章。

书籍也是如此。无论一本书有多好,30行以上的段落频频出现足够将我劝退。同一主题同一领域的不同的十本书中,对读者最友好(当然也要营销好)的书才能成为最畅销书籍。

现在我们知道了书的必备要素,也知道了为什么有些书极具阅读价值却还是看不下去,接着就该探索《深入浅出统计学》的优点了。

我的短评

如前所说,我在约莫一年半前读完这本书,它能为未来探索进阶话题夯实基础。即使现在读一本python统计学的书籍,书中没有详实深入地解释理论,我也不会感到困惑,因为我有扎实的背景知识储备。

这也就是本书真正的目标群体——刚入门的初学者,和修过统计学课程,但因教学方式欠佳收获不大的人。如果修过几门大学统计学和概率论课程,你可能不需要再读这本书了。

本书涵盖如下主题:

·基础信息图形化

·集中趋势与分散性的量度

·概率、排列、组合与分布

·统计抽样

·置信区间

·假设检验

·回归分析

书中讲得非常详实,它不涉及大学课程以外的内容。但如果你不是出身世界名校,我还是认为有这本书的加持更好。

开始之前

毋庸置疑的是,统计学是每个数据科学家必备的工具。而正式教育中的统计学课程要么从未开设,要么效果一般。

图源:unsplash

《深入浅出统计学》此时就派上了用场。不用花费太长时间就可读完,大概需要一到两个月,这取决于你的知识储备和能挤出的阅读时间。读完本书后,你就会更理解数据科学和机器学习领域那些进阶的话题了。

留言点赞


转载请注明:http://www.aierlanlan.com/rzdk/4764.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了