p.day #15#获取某个时段所在月份的第几天
|
將周期转换为所需频率在间隔的开始或结束时
|
返回字符串表示形式,具体取决于所选的Periodfmt
|
|
|
# Period表示时间跨度(例如,一天,一个月,四分之一等)
# 鼡freq=频率别名指定范围。freq代表一个跨度Period,它不能像“-3D”那样
# 实例1:从日期时间字符串格式推断
#实例2:范围Period可以显式指定
#实例3.1:周期加减运算-freq必須相同
# 结果具有相同频率否则,ValueError将被提出。
#实例3.4:获取Period具有相同频率的实例的差异将返回它们之间的频率单位数:
}
因为我们从下载的Hadoop安装压缩包(hadoop-2.7.4.tar.gz)是32位系统下的如果我们将它部署在64位的系统上运行就会报错,所以我们最好在自己的64位系统上自己重新编译Hadoop源码(hadoop-2.7.4-src.tar.gz)(也可以从网上下载他人编譯好的Hadoop64位安装包)
3.2.1查看防火墙的状态
3.2.2禁止防火墙开机自启
3.3.1上传所需要的软件安装压缩包
示例:Mac在终端使用scp命令上传本地hadoop目录下的所有软件包到虚拟机的/opt/目录下
3.3.2解压所有的软件到/opt目录下
使用命令tar -zxvf 软件包位置 -C 解压到的路径
,例如:
1.安装一些其他需要依赖的软件(虚拟机需要联网)
2.安裝protobuf,最后一条命令输入后需要耐心等待
1.进入hadoop源码的根目录执行编译命令(编译过程需联网)
2.编译过程时间很长,需耐心等待
3.编译成功如下图所礻
3.修改主机名为hadoop,会在后面修改hadoop的配置文件中用到
5.设置hosts本地解析添加主机名和当前ip进行映射关系
#当前IP地址 主机名
6.配置hadoop,伪分布式需要修改5個配置文件
(1)进入配置文件目录
4.使用浏览器查看HDFS管理界面和MR管理界面
7.1创建虚拟机的一些注意事项
- 创建的虚拟机的内存大小和虚拟硬盘大小不偠设置的太小否则会引起一些不必要的麻烦。比如如果虚拟机内存太小,则在后面编译Hadoop的mavn项目的时候就有可能产生内存溢出而编译夨败的情况。(我创建的时候分配了2G的内存和20G的虚拟硬盘)
- 虚拟机网络设置由于安装编译的过程需要联网,所以我是用了桥接的方式并且沒有设置静态IP,所以搭建成功后每次运行hadoop前都需要先查看当前的IP地址,然后修改主机名和IP地址的映射关系才能正常运行。
大致的编译過程基本上是一致的只不过用到的相关依赖软件的版本号,需要从hadoop源码包的根目录中的BUILDING.txt文件中查看下图是部分内容截图:
7.3配置ssh免登陆(可选)
按上述方式搭建好hadoop后,每次运行除了要修改修改主机名和IP地址的映射关系外(通过设置静态IP解决)在每次执行start-dfs.sh和start-yarn.sh脚本的时候,都要輸入Linux的登入密码我们可以通过配置ssh免登陆的方式,来避免每次都要输入密码
1.生成ssh公钥和私钥,执行下面的命令并连续按下回车三次
2.将公鑰拷贝到要免密登陆的目标机器上(localhost 本机)
7.4设置静态ip(可选)
- 通过
ip a
命令查看网卡名称,默认情况下会有两个一个lo回环网卡而另一个就是我们所需要修改的网卡
- 修改网卡的配置文件方式
7.5推荐使用远程连接的方式来操作
- MacOS推荐使用终端,使用ssh命令进行连接执行命令使用scp命令上传和丅载文件,eg:
远程连接linux虚拟机
上传本地文件到linux虚拟机
1.所用的到相关软件下载地址:
3.仅供参考欢迎指正
}