第一章 数据——人类建造文明的基石

使用数据的标准流程:

  1. 获取数据
  2. 分析数据
  3. 建立模型
  4. 预测未知

完美的镜头里面的透镜其实不应该是球面镜,而应该是某种复杂的曲面,这样才能使画面不变形,但这样的镜头在设计和制作上要求非常复杂而难以实现,相反如同日本的镜头生产一样,采用多个球面透镜来组合虽然显得笨重,但是容易大规模生产,成本也非常低,因此二战后,日本超过德国成为全球光学仪器(包括相机)第一大制造国。

启发:

  • 由简单模型组合而成复杂功能的模型;
  • 可由若干个简单模型逐渐契合数据(Fit Data)的方法称为数据驱动方法。

大数据的三个特征:

  • 数据量大
  • 多维度
  • 完备性

熵:

  • 混乱度,越混乱熵越大。
  • 如恒温的空气状态。