第一章 数据——人类建造文明的基石
使用数据的标准流程:
- 获取数据
- 分析数据
- 建立模型
- 预测未知
完美的镜头里面的透镜其实不应该是球面镜,而应该是某种复杂的曲面,这样才能使画面不变形,但这样的镜头在设计和制作上要求非常复杂而难以实现,相反如同日本的镜头生产一样,采用多个球面透镜来组合虽然显得笨重,但是容易大规模生产,成本也非常低,因此二战后,日本超过德国成为全球光学仪器(包括相机)第一大制造国。
启发:
- 由简单模型组合而成复杂功能的模型;
- 可由若干个简单模型逐渐契合数据(Fit Data)的方法称为数据驱动方法。
大数据的三个特征:
- 数据量大
- 多维度
- 完备性
熵:
- 混乱度,越混乱熵越大。
- 如恒温的空气状态。