咨询热线13544009511
深圳市和丰软件技术有限公司 > 新闻资讯 > 行业资讯 >
CRM客户关系管理查看更多>
数据挖掘现象背后的机制和规律

作者:admin时间:2020-10-02

除通过数据分析了解现象本身,继续探索现象背后发生的原因规律及内在机制,在大量评价指标中找出隐藏的规律,简单的方式如线性回归,对于城市这样非线性的复杂系统,最基础但有效的包括随机森林等。

以骑行行为挖掘为例,随机森林模型展示了影响骑行轨迹分布权重较大的因素,主要包括道路长度、功能兴趣点POI 总数、道路适宜度水平、公交车站300 米覆盖路段长等。

 
 

以上海城市人口结构挖掘为例,随机森林模型所示,影响上海年轻人分布权重较大的因素主要包括外地人口比重、最近轨道站点距离等。

最后,将利用仿真、模拟为主要手段,反向使用前述数据挖掘得到的结果,应用所获得的规律。通过改变某些指标(对应城市规划或管理措施),使得决策树的走向发生变化,也即开展了一次政策预演,反复试算,使得我们可以基于隐含的规律对城市发展进行大量的沙箱模拟,寻求政策工具的最佳组合。

因此,自然而然地会观察到,围绕数据流开展的这些工作,无论是处理非结构化数据还是剖析非线性关系时,我们都在严重的依赖算法作为工具。在数据时代,算法的价值怎么重视都不为过。

 

全社会广义信息化需求将越来越旺盛。如果把上述数据流过程拓展到整个社会来观察,会发现他们是相辅相成的,不同行业之间需要互相依赖彼此对数据的感知、测度、挖掘,最终实现整个社会的信息化和智能化。

其他人还阅读了

粤公网安备 44030502004788号