无论做什么产品,用户的所有行为汇集成二进制储存在数据库中,数据就这样产生了,像类似微博或者雪球网之类的社群网站,绝大多数的数据却成为了噪音,这些数据就像一颗石子投入大海,下沉到了海底再也找不到了。这个时候恰当的数据处理架构就成了必须,挖掘数据的价值,升华数据的价值。

数据的层次

数据至少应该有三个层次,分别是数据的产生,数据的沉淀和数据的智能。

数据产生

当用户访问网页,发表博文,点赞,评论,亦或是仅仅点击一个链接,这些都是数据,数据的产生最终体现在了数据库中,如果有意,那么用户所有的行为都可能形成数据,甚至在单一网页中的浏览轨迹,点击热量图等。

数据沉淀

数据产生之后是离散的,如果没有拥有一定的组织策略,没有将数据分文别类,那么对于数据本身来说其就不具备任何意义,只有当离散的数据排列组合在一起的时候,数据就成了美妙的音符,一个美妙的旋律就应运而生。

数据智能

数据经过初步的组织,数据本身的潜在价值就会被挖掘出来,但是对于每个用户来说,其所需的数据是不一样的,就意味着不同的数据对于不同的人价值是不一样的,而利用算法,计算不同用户不同的属性,并且匹配不同的数据反馈给用户,这个过程叫做数据的智能,也就是常说的千人千面。

葵零网实例

葵零网是我目前正在开发的一个影视剧垂直类型社群产品,其数据的架构则是我根据以上所述简单设计出来的,详细如图:

葵零网数据架构

用户产生数据分为博文,评论,点赞,图片等,数据的沉淀依靠简单的标签进行分文别类,数据的智能则是根据用户点赞记录、评分记录进行简单的算法推荐。