『云计算』终于有人把云计算、大数据和人工智能讲明白了( 六 )


封闭的环境主要使用了两种技术 , 一种是看起来是隔离的技术 , 称为 Namespace , 也即每个 Namespace中的应用看到的是不同的 IP地址、用户空间、程号等 。 另一种是用起来是隔离的技术 , 称为 Cgroups , 也即明明整台机器有很多的 CPU、内存 , 而一个应用只能用其中的一部分 。
所谓的镜像 , 就是将你焊好集装箱的那一刻 , 将集装箱的状态保存下来 , 就像孙悟空说:“定” , 集装箱里面就定在了那一刻 , 然后将这一刻的状态保存成一系列文件 。 这些文件的格式是标准的 , 谁看到这些文件都能还原当时定住的那个时刻 。 将镜像还原成运行时的过程(就是读取镜像文件 , 还原那个时刻的过程)就是容器运行的过程 。
有了容器 , 使得 PaaS层对于用户自身应用的自动部署变得快速而优雅 。
三、大数据拥抱云计算
在PaaS层中一个复杂的通用应用就是大数据平台 。 大数据是如何一步一步融入云计算的呢?
1数据不大也包含智慧
一开始这个大数据并不大 。 原来才有多少数据?现在大家都去看电子书 , 上网看新闻了 , 在我们80后小时候 , 信息量没有那么大 , 也就看看书、看看报 , 一个星期的报纸加起来才有多少字?如果你不在一个大城市 , 一个普通的学校的图书馆加起来也没几个书架 , 是后来随着信息化的到来 , 信息才会越来越多 。
首先我们来看一下大数据里面的数据 , 就分三种类型 , 一种叫结构化的数据 , 一种叫非结构化的数据 , 还有一种叫半结构化的数据 。

  • 结构化的数据:即有固定格式和有限长度的数据 。 例如填的表格就是结构化的数据 , 国籍:中华人民共和国 , 民族:汉 , 性别:男 , 这都叫结构化数据 。
  • 非结构化的数据:现在非结构化的数据越来越多 , 就是不定长、无固定格式的数据 , 例如网页 , 有时候非常长 , 有时候几句话就没了;例如语音 , 视频都是非结构化的数据 。
  • 半结构化数据:是一些XML或者HTML的格式的 , 不从事技术的可能不了解 , 但也没有关系 。
其实数据本身不是有用的 , 必须要经过一定的处理 。 例如你每天跑步带个手环收集的也是数据 , 网上这么多网页也是数据 , 我们称为Data 。 数据本身没有什么用处 , 但数据里面包含一个很重要的东西 , 叫做信息(Information) 。
数据十分杂乱 , 经过梳理和清洗 , 才能够称为信息 。 信息会包含很多规律 , 我们需要从信息中将规律总结出来 , 称为知识(Knowledge) , 而知识改变命运 。 信息是很多的 , 但有人看到了信息相当于白看 , 但有人就从信息中看到了电商的未来 , 有人看到了直播的未来 , 所以人家就牛了 。 如果你没有从信息中提取出知识 , 天天看朋友圈也只能在互联网滚滚大潮中做个看客 。
有了知识 , 然后利用这些知识去应用于实战 , 有的人会做得非常好 , 这个东西叫做智慧(Intelligence) 。 有知识并不一定有智慧 , 例如好多学者很有知识 , 已经发生的事情可以从各个角度分析得头头是道 , 但一到实干就歇菜 , 并不能转化成为智慧 。 而很多的创业家之所以伟大 , 就是通过获得的知识应用于实践 , 最后做了很大的生意 。
所以数据的应用分这四个步骤:数据、信息、知识、智慧 。
最终的阶段是很多商家都想要的 。 你看我收集了这么多的数据 , 能不能基于这些数据来帮我做下一步的决策 , 改善我的产品 。 例如让用户看视频的时候旁边弹出广告 , 正好是他想买的东西;再如让用户听音乐时 , 另外推荐一些他非常想听的其他音乐 。
用户在我的应用或者网站上随便点点鼠标 , 输入文字对我来说都是数据 , 我就是要将其中某些东西提取出来、指导实践、形成智慧 , 让用户陷入到我的应用里面不可自拔 , 上了我的网就不想离开 , 手不停地点、不停地买 。


推荐阅读