当前位置:首页 > 数学课件 > 正文内容

学大数据需要有基础吗?

zhao_admin9个月前 (09-05)数学课件27

作为我的主要研究方向之一,我来回答一下这个问题。

大数据是一个统称,就像电子商务一样,大数据本身涵盖了很多内容,同时大数据也提供了很多岗位,不同岗位扮演着不同的角色及不同的任务。

大数据涵盖了从数据的采集、整理、传输、存储、分析到呈现的一系列内容,所以对于不同基础的人可以根据自己的实际情况来选择从事哪个方向。

同时大数据与物联网、云计算关系密切,通常大数据的采集端要涉及到与物联网相关的内容,数据的传输、存储又涉及到与云计算相关的内容,所以学习大数据的过程也会涉及到很多关于物联网和云计算的内容。可以说大数据本身就是一个交叉学科,涉及到诸多不同学科的内容,这其中比较重要的有数学、计算机、网络、统计等等,下面逐一分析一下。

学习大数据要有一定的编程基础,这是大数据大部分岗位都需要的。目前从事大数据方向的程序员比较普遍使用的语言有四种,分别是Python、Java、Scala和R,这四种语言都有一定的应用场景,不同岗位的程序员使用的语言也稍有不同。

Python目前主要是应用在数据分析、数据挖掘和算法实现上,可以说大数据领域Python的应用是比较普遍的,未来Python语言在大数据应用领域的发展也是非常值得期待的。

Java是老牌程序开发语言了,目前Java在大数据领域的应用还是跟平台有直接关系,通常在需要高性能的数据处理部分采用Java开发,但是由于Java开发过于麻烦,目前很多大数据程序员使用Java都比较谨慎。

Scala和R主要是基于场景的应用多一些,Scala构建在Java基础之上,代码结构要比Java简洁一些,同时Scala是Spark的实现语言,在与Spark相关的开发中使用Scala是比较方面的选择。R语言本身的特点就是统计分析,语法简单且功能强大,是做大数据统计分析的一把利器。

数学基础是做大数据研发岗位(并不是所有大数据岗位都需要数学)的重要基础,大数据应用的一个核心就是通过算法来对数据进行整理分析,从杂乱无章的数据中寻找规律,所以需要一定的数学基础。这其中需要了解线性代数、概率、离散数学、微积分等,还有一个很重要的课程叫算法导论,这些都需要重点学习和掌握的。

当然,学习大数据一定离不开与各种数据库打交道,无论是传统的数据库,还是NoSql数据库,在大数据应用中都要涉及到相关知识。

未来每个公司都需要有专门的岗位来做大数据相关工作,所以学习并掌握大数据的一些知识对未来的职场发展还是非常有帮助的。

作为我的一个主要研究方向,大数据占据了我目前很大一部分的工作时间,目前很多实际的研发项目都与大数据关系密切。如果大家有关于大数据方面的问题可以给我私信,有实际问题也可以一起探讨,谢谢。

嗯,是的的确需要有基础。其实整个大数据在实际商业世界的应用链条比较长。大概分成如下几块:大数据集群的运维、数据的收集、数据的计算、数据仓库、数据应用(报表、数据挖掘、推荐、搜索、广告和风控)。当然宏观上来说大概需要如下一些基础:

1.计算机系统及编程基础:如linux、shell、java、python、Scala等

2.分布式、实时数据收集和计算Hadoop、spark、kafka、storm、flink等等

3.数据仓库设计及报表展现:模型设计工具如 datastage,di,informatic,展现工具如tablueau等

4.数据分析和挖掘工具:如R、python(sklearn)等

5.机器学习和深度学习工具:spark mllib、tensorflow、pytorch等

6.各种机器学习方法和算法:比如logistic回归、FFM模型、xgboost、深度学习等等

一般来说一个人不太可能对大数据应用的每个环节都懂。如果你想做大数据平台相关java、Hadoop、spark、Kafka肯定是要有了解的。如果是做数据应用相关环节,比如广告。那你对常规的机器学习算法及深度学习一定要有所了解的。以上是个人的一些浅见。欢迎拍砖。

扫描二维码推送至手机访问。

版权声明:本文由PPT写作技巧发布,如需转载请注明出处。

本文链接:http://www.ppt3000.com/post/76210.html

分享给朋友:

相关文章