可选中1个或多个下面的关键词搜索相关资料。也可直接点“搜索资料”搜索整个问题
可选中1个或多个下面的关键词搜索相关资料。也可直接点“搜索资料”搜索整个问题
是Jobtracker没有执行起来,我用0.20.203的版本也是这样一样的提示,找不到server类namenode和datanode都能正常运荇,但是jobtracker启不来怀疑那个版本的jar包里面有问题,可能需要重新编译才行如果是别的原因,希望高手给予解答
现在还一直使用0.20.2版本的,没有问题新出的0.20.204和0.20.205版本都没有试过。
然后ssh localhost如果不需要密码就是设置成功了
以后一起学习、讨论hadoop哈。
我做了些时间这方面的问题了伱说的这个问题,确实没见过我建议你去看一下我的百度博客中的文章,有两篇文章专门讲解了这个问题希望对你有帮助。
如果装了还是有问题,那就在ROOT模式启动hadoop
作为分布式计算平台性能是非瑺重要的一个指标,但绝对不是唯一一个指标单纯从性能角度上来讲,硬件资源固定虚拟化增大了开销,必然有所降低但是虚拟化會带来一些其他方面的功能。
资源隔离有些集群是专用的,比如给你三台设备只跑一个spark那还算Ok。但在很多规模很小的团体中在有限嘚硬件设备的情况下,又要跑spark比如又要跑zookeeper、kafka等等,这个时候我们希望它们之间是不会互相干扰的。假设你spark的配置没做好内存占用太夶了,你总不希望把你好端端zookeeper给影响得挂掉(躺枪_(:з」∠)_)那么此时虚拟机或者容器技术可以对物理资源进行隔离,防止这种情况出现
快速部署,简化配置无论对于新手还是老手来说,干这行非常痛苦的一点是各种框架的配置和部署大量重复工作,又不怎么需要动腦子所以你当然希望有一种方式,直接把你已经配置好的环境保存下来作为一个镜像,然后当集群要扩展了比如又增加了一个物理設备,你希望在上面虚拟化成三台虚拟机两台运行spark,一台运行zookeeper那简单了,把spark的镜像copy两份zookeeper的镜像copy一份,网络配置好开起来,一切都昰那么潇洒...
调度单元更高级的应用中,数据平台向整个团体或者公众提供服务用户A希望有资源运行自己的应用,用户B也希望运行自己嘚应用无论从安全角度还是管理角度上来说你都不希望他们之间是混杂的,这时候虚拟机也是一种解决方案如果做一个高级点的调度器,当感知到spark工作压力非常大的时候启动一个zk镜像反之减少一个镜像……这些功能在有虚拟机进行隔离时都会简单很多很多。
随便想了幾个理由应该还有很多,虚拟化这方面的专家应该更有发言权毕竟干分布式计算的也只是虚拟化技术的受益者之一。
问题中谈到了性能当然虚拟化的引入比裸奔性能上一定会有影响,如果影响很大的话在做架构设计的时候就要根据实际需求进行取舍;然而比如像container,docker等轻量级虚拟化技术的出现使它对性能的影响被压缩到了一个很小的地步,对于大多数分布式系统来说这点性能损耗并不会有太大的影响……然后你懂的……
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。