Pivotal Knowledge Base

フォローする

Ambari 1.7.1 から 2.1.2 にアップグレード後、全てのサービスを再起動すると HAWQ が起動しない

環境

製品 バージョン
Pivotal HD 3.0.x
Ambari 1.7.1 / 2.1.2
Pivotal HDB 1.3.x

事象

Ambari 1.7.1 から 2.1.2 にアップグレード後、全てのサービスを再起動しようとすると失敗する。その際、GUI では以下のエラーで HAWQ の起動に失敗している。  

エラーメッセージ:

Ambari web GUI でログを確認すると、以下のようなログエントリーが見られる。 

  tries=tries, try_sleep=try_sleep)
File "/usr/lib/python2.6/site-packages/resource_management/core/shell.py", line 140, in _call_wrapper
result = _call(command, **kwargs_copy)
File "/usr/lib/python2.6/site-packages/resource_management/core/shell.py", line 291, in _call
raise Fail(err_msg)
resource_management.core.exceptions.Fail: Execution of ' hdfs dfs -chown -R gpadmin:gpadmin /hawq_data' returned 1. chown: Call From amb171.lab/192.168.177.153 to amb171.lab:8020 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused

原因

  • HAWQ が NAMENODE 起動前に再起動しようとする。 
  • 再起動順が変わってしまう理由は、Ambri のアップグレード中に /var/lib/ambari-server/resources/stacks/PHD/3.0/role_command_order.json の内容が置き換わってしまい、HAWQ に関する順序設定がなくなってしまうためである。

解決策

Ambari サーバーノード上で、root ユーザーとして以下の手順を実行する。

1. バックアップされた role_command_order.json ファイルを、運用スタックにコピーする(以下のコマンドでは、stacks_10_03_16_16_18 は、各自のクラスター上の特定ディレクトリー名に置き換えることになる)。 

cp /var/lib/ambari-server/resources/stacks_10_03_16_16_18.old/PHD/3.0/role_command_order.json /var/lib/ambari-server/resources/stacks/PHD/3.0/

2. ambari-server を再起動する。

ambari-server restart

3. 全てのサービス起動を再実行する。

注意: HAWQ 1.3.1.0 がインストールされていると、ナレッジベース記事「Ambari 1.7.1 から 2.1.2 にアップグレード後、"'format_stack_version' is not defined" というエラーが発生し PXF が起動しない」に該当する場合は、依然として PXF の起動に失敗する可能性がある。

内部情報

注意: JIRA チケット GPSQL-3265 にて議論。

コメント

Powered by Zendesk