AIXスレッド Technology Levels 06(Part6)

2007/10/31(水) 09:44:51
前スレ↓

AIXってどうよ?
http://pc.2ch.net/test/read.cgi/unix/983119306/

AIXスレッド MaintenanceLevel 02(Part2)
http://pc.2ch.net/test/read.cgi/unix/1022486427/

AIXスレッド MaintenanceLevel 03(Part3)
http://pc5.2ch.net/test/read.cgi/unix/1054451433/

AIXスレッド MaintenanceLevel 04(Part4)
http://pc8.2ch.net/test/read.cgi/unix/1093514646/

AIXスレッド Technology Levels 5300-04-01(Part5)
http://pc11.2ch.net/test/read.cgi/unix/1151434734/l50

【各種情報はこちら】
IBM System p - Japan
http://www-06.ibm.com/systems/jp/p/
developerWorks Japan(AIX)
http://www-06.ibm.com/systems/jp/p/aix/developer/
IBM System p および AIX インフォメーション・センターへようこそ
http://publib.boulder.ibm.com/infocenter/pseries/v5r3/
Quick links for AIX fixes
http://www14.software.ibm.com/webapp/set2/sas/f/genunix3/aixfixes.html

なんやかんや言いながら5スレ目になったので、少しテンプレに情報載せてみました。
2008/04/12(土) 00:14:16
最近AIXはめっきり触っていないんだが、まだプログレスバーの代わりに走る人がいるの?俺あの人好きだ。失敗したらこけるから。
2008/04/12(土) 12:27:33
成功するとピースするし。
AIX6で、ちょっと大股になった気がする。
2008/04/14(月) 10:55:31
smitコマンドなんて普段から使ってるの?
115名無しさん@お腹いっぱい。
垢版 |
2008/04/14(月) 20:37:02
AIX5.3でrootvgをミラーした状態でTL7をupdate_all適応すると地獄に行きます。

だいたいsmit.logの中に
bos.net.tcp.client.post_u[63]: test: 0403-021 文字 ] がありません。
処理したファイルセット: 478 の 315 (合計時間: 20 分 59 秒)

って何だよ!

いいかげんユーザーを人柱にするのはやめてくれ。

せめて確認してから公開しろ。
2008/04/14(月) 20:51:35
世界のIBMw
2008/04/15(火) 15:10:48
>>115
何をいまさらw

少し前なんてAPAR当てたらkshの仕様変更があったんだけど、
システム系のシェルスクリプトがその変更に対応してないってのがあったよ。
その結果そのTL当てたmksysbが全滅したけどね。

>いいかげんユーザーを人柱にするのはやめてくれ。
>
>せめて確認してから公開しろ。
これに関してはもちろん同意するけど、やっぱりテスト環境でチェックしてから
TLをあげるってのは重要だなって思ったよ。
2008/04/16(水) 09:46:16
>>115
> bos.net.tcp.client.post_u[63]: test: 0403-021 文字 ] がありません。
> 処理したファイルセット: 478 の 315 (合計時間: 20 分 59 秒)

LANG=Cをしてない時点でお前の負け
2008/04/16(水) 11:15:42
IBM信者は気楽でいいぜw
120115
垢版 |
2008/04/17(木) 00:08:39
115だが....

>その結果そのTL当てたmksysbが全滅したけどね。

スマソ 言葉が足りなかった。smit.logは大した問題じゃない。

根本的な問題はLVをミラーしているときupdate_allすると途中でLVが拡張できなくなる。

rootvgをミラーするってのは一般的な使い方だと思うんよ。
不思議なのは奴らはrootvgをミラーしないでチェックしているってこと?

>これに関してはもちろん同意するけど、やっぱりテスト環境でチェックしてから
>TLをあげるってのは重要だなって思ったよ。

これもオリが悪かった。別環境でupdate_allしたとき大きなトラブルがないものだから
あまり考えずにおこなっちまったことだ。悲しかったのは金曜日の夜にupdateして
元に戻すのに日曜日までかかった。休日を返せ>IBMって。

>>118
>LANG=Cをしてない時点でお前の負け

東洋の黄色いサルは使うなってことか....

負けるのは今に始まったことじゃない。ファームを上げたりOSを上げたりするたびに
必ず何らかの問題を抱える。それもOS等の問題で....
そして元に戻すの連続さ。1つが修正されるとまた新たな不幸がやってくる。

これだけユーザーに迷惑をかけてもやっていける会社ってある意味凄い会社だと思う。
2008/04/17(木) 03:05:35
>>120
TLあげるのにmksysb取ってないの!?
あと「LVをミラーしているときupdate_allすると途中でLVが拡張できなくなる」の意味がわからない。
まあ、>>120はHP-UX使ってても同じこと言うんだろうな、と思った。
2008/04/17(木) 05:51:23
うん、M$とかLiでサーバ組んでるよりは
遙かに安心できると思うけど。

まぁ、IBMサポの態度がでかいのはワカルヨ。
123120
垢版 |
2008/04/23(水) 19:05:53
スマヌ。カットオーバー直前で忙しくて書き込めぬ。

>121
>TLあげるのにmksysb取っていないの!?

うん。サービス用ではないので取っていない。

地獄に行ったのは私だけだし...。

ま、復旧は時間がかかるだけで物を詰めて行くだけ。

>あと「LVをミラーしているときupdate_allすると途中でLVが拡張できなくなる」の意味がわからない。

update_allしている途中で/usrとかのFSを自動的に拡張していく。それが途中で
Failする。見るとLV領域をデカクしようとしてコケている。

LVM系にBugがあるみたいで....まだどのFilesetが原因なのか調べていないが....

HP-UXは大昔に使ったことがあるが今は知らない。でもOSが上がらないのは完全にOUT。
124120
垢版 |
2008/04/23(水) 19:06:39
>うん、M$とかLiでサーバ組んでるよりは
遥かに安心できると思うけど。

驚いたのはrebootさせたら、OSが上がらなかった。:-(

あのM$でもUpdateをかけて再起動したらOSが上がらないってことはあまりないと
思うが.....

ま、JFS(2)が元気なら他のmksysbが入っているPVを持ってきてそいつでOS上げて
OSが上がらないrootvgをくっつけてmountしてやれば重要なfileは救える。

詳しくは調べていないが、ミラーしているとhd5(bootlv)を消去して新規hd5を
作っている(多分:未確認)その周囲に問題があるようだ。

あと古い5.3のBOSCD使ってメンテモードを上げようとすると変なメッセージを
吐きながら無限ループに陥るし。自分で新しいメンテ用CDを作れってことかよ。

TLをDLするとき

     ”何があっても文句を言うなボタン”

を押してからDLしているのでこれ以上は言えないが....

満足に確認されていない状態でTLを公開するからユーザがドツボにハマル。
そして馬鹿高いサポートに金を払う。原因はOSを作っている側にあるのに....

ソフトの品質が低い程、サポートが儲かる素晴らしいビジネスモデルです。
125120
垢版 |
2008/04/23(水) 19:18:10
120だがたまたま変な現象を目撃。
networkが遅かったのでnetstatしてみた。

# netstat -v en0
-------------------------------------------------------------
ETHERNET STATISTICS (ent0) :
Device Type: IBM 10/100 Mbps Ethernet PCI Adapter (23100020)
Hardware Address: 00:60:94:xx:xx:xx
Elapsed Time: 0 days 2 hours 10 minutes 19 seconds

Transmit Statistics: Receive Statistics:
-------------------- -------------------
Packets: 1495909 Packets: 998618
Bytes: 2243467216 Bytes: 60146622
Interrupts: 11342 Interrupts: 373215
Transmit Errors: 76827 Receive Errors: 0
Packets Dropped: 0 Packets Dropped: 0
途中略
Bad Packets: 0Lost CTS Errors: 0 Alignment Errors: 0
Max Collision Errors: 0 No Resource Errors: 0
Late Collision Errors: 76701 Receive Collision Errors: 0
Deferred: 4753 Packet Too Short Errors: 0
SQE Test: 0 Packet Too Long Errors: 0
Timeout Errors: 0 Packets Discarded by Adapter: 0
Single Collision Count: 3471 Receiver Start Count: 0
Multiple Collision Count: 198
Current HW Transmit Queue Length: 1

つづく
126120
垢版 |
2008/04/23(水) 19:20:26
Lost CTS Errors: 0 Alignment Errors: 0
Max Collision Errors: 0 No Resource Errors: 0
Late Collision Errors: 76701 Receive Collision Errors: 0
Deferred: 4753 Packet Too Short Errors: 0
SQE Test: 0 Packet Too Long Errors: 0
Timeout Errors: 0 Packets Discarded by Adapter: 0
Single Collision Count: 3471 Receiver Start Count: 0
Multiple Collision Count: 198
Current HW Transmit Queue Length: 1

途中略

IBM 10/100 Mbps Ethernet PCI Adapter (23100020) Specific Statistics:
------------------------------------------------
Chip Version: 25
RJ45 Port Link Status : up
Media Speed Selected: Auto negotiation
Media Speed Running: 100 Mbps Half Duplex
Receive Pool Buffer Size: 384
No Receive Pool Buffer Errors: 0
Inter Packet Gap: 96
Adapter Restarts due to IOCTL commands: 0
Packets with Transmit collisions:
1 collisions: 3471 6 collisions: 0 11 collisions: 0
2 collisions: 190 7 collisions: 0 12 collisions: 0
3 collisions: 8 8 collisions: 0 13 collisions: 0
4 collisions: 0 9 collisions: 0 14 collisions: 0
5 collisions: 0 10 collisions: 0 15 collisions: 0
Excessive Deferrals: 0

つづく
127120
垢版 |
2008/04/23(水) 19:26:16
ん?なんじゃいcollisionってやつは?

# lsattr -El ent0
alt_addr 0x000000000000 代替イーサネット・アドレス 真
busintr 6 バスの割り込みレベル 偽
busio 0xbff800 バスの I/O アドレス 偽
fast_reset yes 高速リセットを使用可能にする 真
intr_priority 3 割り込み優先順位 偽
ip_gap 96 パケット間ギャップ 真
mcast_filter no マルチキャスト・フィルタリングを使用可能にする 真
media_speed 100_Full_Duplex メディア・スピード 真
poll_link no リンク・ポーリングを使用可能にする 真
poll_link_timer 500 リンク・ポーリングの時間間隔 真
rx_hog 1000 RX 割り込みごとに処理された RX バッファー 真
rx_que_size 256 受信キューのサイズ 真
rxbuf_pool_size 384 受信バッファー・プールのサイズ 真
slih_hog 10 割り込みごとに処理された割り込みイベント 真
tx_que_size 8192 送信キューのサイズ 真
use_alt_addr no 代替イーサネット・アドレスを使用可能にする 真

RS6000側は100_Full_Duplexに固定にしているし、
ネットワーク機器側も100 Fullの固定になっている。

訳解かんね〜(怒)

理由が解らないないからいつものreboot。それから幾らやっても再現なし。

見なかったことにしよう。-:)

これでカットオーバーが無事に行くのか?
128120
垢版 |
2008/04/23(水) 19:33:29
不思議なのはlsattr -El ent0で見ると

media_speed 100_Full_Duplex

なのに

netstat -v en0すると

Media Speed Selected: Auto negotiation
Media Speed Running: 100 Mbps Half Duplex

なんでやねん?

こんなことが毎日続く。
2008/04/23(水) 23:42:06
>>128
お前のスキルが死ぬほど不足してるのはわかったらもう書き込みはやめとけ。
ここはお前の日記ではない、チラシの裏は自分の日記でやれ。
2008/04/24(木) 00:48:05
イーサネット勉強しなおしてこい
話はそれからだ >120
131120
垢版 |
2008/04/24(木) 01:52:51
>>129

確かにトラブルの連続で凄くスキルが不足していると思う。
何でこんなトラブルが発生するのか理解できん。

>>130

何で100M Full固定と100M Full固定で接続しているのに方側のRS6000側が

Media Speed Selected: Auto negotiation
Media Speed Running: 100 Mbps Half Duplex

になり、collision counterが上がるのか?

これを解決するにはイーサネットの何を勉強すればいいのか教えて欲しい。
ネットワークはシロートなんで....
2008/04/24(木) 02:23:32
>>131
サポートに問い合わせしてくれ。
とにかく無駄なことをここに書き込むな。
2008/04/24(木) 02:34:58
IBM社員、顔真っ赤w
2008/04/24(木) 03:11:48
>>133
IBM社員に顔を真っ赤にするほどの愛社精神がある奴はいないって。
135120
垢版 |
2008/04/24(木) 04:21:06
>>132
>サポートに問い合わせしてくれ。
>とにかく無駄なことをここに書き込むな。

ここに書き込むとOSがBugだらけってのがバレだからか?:-)

尻尾を掴もうにも現象が再現しないんよ。こんなときのサポートって
役にたたない。

もっと訳わかんねーのは
”何でトラブルで徹夜しなければならないのか?”
ってことだ。
2008/04/24(木) 04:41:14
>>135
>ここに書き込むとOSがBugだらけってのがバレだからか?:-)
いや、「こんなトラブルがあってムカつく」っていうのを延々と書かれても
ここで無駄な情報が増えるだけだから嫌なんだよ。

書くんだったら「こういうトラブルがあって、こうやって解決しました」ってのを書いてくれ。
他の人も言ってるがここはお前の日記帳じゃないんだよ。

>もっと訳わかんねーのは
>”何でトラブルで徹夜しなければならないのか?”
>ってことだ。
お前がまともな設定も出来ないうえに問題解決能力も無いSEだからじゃないか?
137120
垢版 |
2008/04/24(木) 04:59:31
>>136
>お前がまともな設定も出来ないうえに問題解決能力も無いSEだからじゃないか?

確かに問題は解決できない。オイラにできることは次の修正が出るのを待つだけだ。

では聞くが”OSのBugに遭遇しないまともな設定”とやらを教えてくれ。
2008/04/24(木) 05:34:08
>>137
>では聞くが”OSのBugに遭遇しないまともな設定”とやらを教えてくれ。
子供が駄々をこねてるときの発言と一緒だな。

どんなOS使ってもバグに遭遇するのは当たり前、
そうなったときにこんな所で愚痴らずにベンダーと解決(回避策)に取り組めばいい。
それが出来るようになってからいっぱしの口を聞く様にしてくれ。
139120
垢版 |
2008/04/24(木) 05:53:37
>どんなOS使ってもバグに遭遇するのは当たり前、

そんなことは理解している。問題なのは信じられないケースでBugに遭遇することだ。

たとえばrootvgをミラーしている状態でupdate_allすると問題が発生する。
オイラはrootvgをミラーして使うのは普通だと思っている。レアケースではの
Bugはしょうがない。しかしズバリは修正を出す前にメーカーサイドのチェックで
十分に防げると思うのだが....

完全なテスト不足だと思っている。

>そうなったときにこんな所で愚痴らずにベンダーと解決(回避策)に取り組めばいい。
>それが出来るようになってからいっぱしの口を聞く様にしてくれ。

”修正が出るまで使うな”って報告(回避策)に対していっぱしの口を聞く様になりたい。

138は関係者か?こんな時間まで火消しに付き合うのも大変だな。
2008/04/24(木) 07:55:56
君がSEとして経験不足なのはよくわかったから、続きはブログでどうぞ。
ブログの方が色んな人に読んでもらえてIBMのAIXがバグだらけなのを宣伝できるよ。
2008/04/24(木) 08:08:22
ここに書いてもいいんだよ
2008/04/24(木) 08:10:32
>>141
あまりにも酷い自演だ・・・。
2008/04/24(木) 08:14:39
え?おれ?
まあ君がエスパーでないことは分かった
2008/04/24(木) 16:22:46
IBM切っちゃえば良いじゃん
2008/04/24(木) 21:37:29
まあAIX使い続ける理由はあまりない
2008/04/24(木) 21:40:23
update_allがこける原因をミラーリングに求めた根拠がわからん。
2008/04/24(木) 21:40:42
>>139
AIX5.3 rootvg LVMミラーリング、TL10へupdate_all
一回も問題でたことない。

問題があるのは分かったからSTSCに投げてWWQAに転送してもらえ
2008/04/24(木) 21:41:40
×TL10
○TL7
149120
垢版 |
2008/04/24(木) 22:37:59
>update_allがこける原因をミラーリングに求めた根拠がわからん。

TL7に上げるときrootvgをミラーしているのだけ死んだから。
詳しいことはGWが終わってから調べるつもり
2008/04/24(木) 22:49:51
>>128
マジレスすると、
> Media Speed Selected: Auto negotiation
これは、デバイスがauto negotiationで設定されている事実を表してる、で
> Media Speed Running: 100 Mbps Half Duplex
これは、negotiationの結果100_Halfが選択された事実を表してる
片方がネゴシエーションしないでもう片方がネゴシエーションしようとすると半二重になるのはほぼ仕様なので、これは正しい

> 不思議なのはlsattr -El ent0で見ると
> media_speed 100_Full_Duplex
これはODMに100_Full_Duplexと書いてある事実を表してるが、"Media Speed Selected"と食い違っている
なぜODMだけこうなっているのかが分からないので、これが問題

多分、動作中のAIXに対してODMだけ100_Full_Duplexに更新したんじゃね?
そもそも稼働中のentデバイスのmedia_speedを変更ってできないはず。
今の状態からいったんen0をdetachしてからent0をrmdev→mkdevしてもう一度en0をupするか、
さもなきゃOSごとリブートすればいいと思う
2008/04/24(木) 22:50:21
>>149
次は解決するまで書き込まなくて良いよ。
2008/04/24(木) 22:52:06
>>128
やっぱり掲示板で関西弁で発言するヤツは変な人多いんだな。
2008/04/24(木) 22:54:40
>>120みたいなトラブルになってる人はほんのごく少数なんだと思うんだけどな〜、
大体そんなにバグだらけだったらこのスレで十分祭りになるだろうし。
>>120が変な設定ばかりしてるとしか思えんな。
154120
垢版 |
2008/04/24(木) 23:27:00
>>150
マジレスサンクス

最初はlsattr -El ent0の表示がおかしいと思ってodmgetしたんよ

name = "ent0"
attribute = "media_speed"
value = "100_Full_Duplex"
type = "R"
generic = "DU"
rep = "sl"
nls_index = 70

ODM的には正しい動きだった。じゃあ何故Media Speed Selected: Auto negotiationなったのかが問題。
普通Netが稼動中の場合、 smitすると

メソッド・エラー (/usr/lib/methods/chgent):
0514-062 指定されたデバイスが使用中であるため、
要求された機能を実行できません。

って怒られるから稼動中に変更したとは思えない。

それに現象それ1回だけで、どうやっても再現しない。何故Autoになっちまったかだ?

>大体そんなにバグだらけだったらこのスレで十分祭りになるだろうし。
>>>120が変な設定ばかりしてるとしか思えんな。

自分では普通の使い方だと思っているが....多分:-)

このネットのトラブルも普通に動いていたので
多分、他のユーザーは気がつかないのではないかな?
2008/04/24(木) 23:58:06
>自分では普通の使い方だと思っているが....多分:-)
>
>このネットのトラブルも普通に動いていたので
>多分、他のユーザーは気がつかないのではないかな?
普通は最初の疎通の時にスイッチ側でも設定通りリンクアップしてるかを確認してもらうから気づかないことは絶対無い。
ネットワーク関連の勉強を一からし直してきてくれ。
156120
垢版 |
2008/04/25(金) 00:29:40
>>155

当然L1 UP L2 UPを確認している。もちろん最初も確認したしトラブル時の今回もだ。
pingも投げたてOKを確認した。なので普通に動いていると判断した。

しかし速度があまりでない。なのでnetstat -v en0した。そこで100M Full duplexなのに
collisionが上がっているから へ?100M Fullなのに何collisionって?
で100 Mbps Half Duplexで何じゃこりゃ??

>ネットワーク関連の勉強を一からし直してきてくれ。

100M Full duplexで固定設定しているのにもかかわらずAIX側がAutoになったのかがワカラネー

じゃあ聞くが1から勉強しなおすとこれの理由が解るようになるのか?
俺は解決能力がないから155が馬鹿な俺に教えてくれ。
2008/04/25(金) 00:54:57
次のリプレースのタイミングでAIXやめりゃいいじゃん。
158120
垢版 |
2008/04/25(金) 01:13:32
>>157

AIXやめたい。でも台数と上に動くソフトがそれを許さない。
俺の意思と反して組織がAIXとLinuxになっていく。

時々IBMと心中するきかよ!って思うことが....

6.1を動かして確認しなきゃならないこともあるし、このクソ忙しい時に
”ちょっとこんな現象があるんだけど解析してくんない?”ってこの俺に....

185に6.1乗っけたまんまで放置状態。WPARの動作をもっと確認しなければならないのだが....
時間は幾らあっても足りない。
2008/04/25(金) 01:33:03
SEがスキルのなさをOSのせいにするスレはここですか?

61を動かさなきゃ確認できないことって何だよ。
確認しなきゃいけないWPARの動作って何だよ。
WPARはLPMあってこそだと思うけどな。p5ならおとなしく53使え。

徹夜が好きそうだから解析するなら止めないけど。
160120
垢版 |
2008/04/25(金) 01:44:12
>>159

上で動くタコアプリが6.1のWPARでもまともに動作するかだよ。

>WPARはLPMあってこそだと思うけどな。p5ならおとなしく53使え。

俺も同じ意見だが、それを許しちゃくれない組織なんだよ。
2008/04/25(金) 01:47:21
なんの解決策も出さないお前もどうかと思うがな。
162120
垢版 |
2008/04/25(金) 02:03:19
>161

解析しようにも再現もしない。これの解決策をどうだせばいいのか?

俺はスキルが無さ杉だから、言ったからには手本となる解決策を教えてほしい。
2008/04/25(金) 02:45:14
アプリをWPARで動かして何したいんだか。
2008/04/25(金) 03:22:03
デバイスが勝手にautoになるはずねーよ
きっとODMが最初にautoだったんだろ。ただの初期設定ミスだよ
それだって一応リンクアップのLEDは点灯するし、pingだって通る
で、後から気づいた誰かがODMだけこそーり元に戻したんだろうな

あくまで推測だが、まあ悪いのはchdev -Pだけやってしらばっくれてた奴だな
もしかしたらsmit.logに怪しいchdevが記録されてるかも知れんから調べてみたら?
2008/04/25(金) 11:52:48
>>156
>当然L1 UP L2 UPを確認している。もちろん最初も確認したしトラブル時の今回もだ。
>pingも投げたてOKを確認した。なので普通に動いていると判断した。
ちゃんとスイッチ側で100Fullになってるかを確認してもらうんだよ、
担当がいなきゃ自分でスイッチに入って確認しろ、そういう所が技術不足なんだよ。

>100M Full duplexで固定設定しているのにもかかわらずAIX側がAutoになったのかがワカラネー
>
>じゃあ聞くが1から勉強しなおすとこれの理由が解るようになるのか?
>俺は解決能力がないから155が馬鹿な俺に教えてくれ。
なんでなんの得もしないのにお前に教えないとだめなんだよw
そうやってすぐに「俺が馬鹿だから教えてくれよ」とか言うところがダメSEの証拠。

お前の馬鹿な書き込みのせいでここに無駄な情報が蓄積されているのがわからんのか?
さっさと消えるか自分のブログに書いてろ。
2008/04/25(金) 12:11:23
>>162
>>161
>解析しようにも再現もしない。これの解決策をどうだせばいいのか?
>俺はスキルが無さ杉だから、言ったからには手本となる解決策を教えてほしい。
いや、だからSTSCに聞けよ。
無償で人に技術を教えてもらえおうなんて乞食と一緒、最近は乞食でも空き缶集めてるぞ。
STSCもイマイチだけど「STSCツカエネー」って言ってる奴は本人も大体使えない奴だ。
使えなくてもSTSCの技術者のレベルを察知してこちらから問題解決に導くようにする、
それが出来ないんならばどこで何やってもだめだろう。
167120
垢版 |
2008/04/25(金) 12:25:00
>>165

Cat2950でsh int f0/20しちおるがそれが何か?

>なんでなんの得もしないのにお前に教えないとだめなんだよw
>そうやってすぐに「俺が馬鹿だから教えてくれよ」とか言うところがダメSEの証拠。

ま、俺の悪い頭でも、お前の頭レベルじゃあ十分に説明できないってことは十分に理解しているから安心しろ
2008/04/25(金) 12:33:09
>>167
>ま、俺の悪い頭でも、お前の頭レベルじゃあ十分に説明できないってことは十分に理解しているから安心しろ
AIXも使いこなせない奴がなにをいってんだかw

お前が遭遇してるトラブルが他の人が遭遇したことの無いものばかりってのが、どういう意味が理解出来ない馬鹿なんだね。

169120
垢版 |
2008/04/25(金) 12:39:54
>いや、だからSTSCに聞けよ。

聞くのだったら別のチャネルがある。

問題はこちらが現象を完全に掴んでいないことだ。
100%の証拠を掴んでいればいつものごとく”ホレ”で言うが
証拠がないし、こっちも再現しようにもあれ1回で解析不能。

4.2.1から数々の問題を報告してきたが狼は1回もない。
つまらんことで汚点は残したくない。
170120
垢版 |
2008/04/25(金) 12:52:09
他が遭遇してないのにIは修正を出すがそれが何か?
171120
垢版 |
2008/04/25(金) 12:59:49
>デバイスが勝手にautoになるはずねーよ

だよなぁ....ボソ まったく再現しない時点で疑いは持っている。

過去のODMの設定が反映されていないってトラブルがあったのだが....
2008/04/25(金) 13:38:56
>>
2008/04/26(土) 00:38:48
>>168
煽りのようで実は結構的を射た話で。
そんな基本的なところでバグがあるなら大問題になってるんだよ。
大問題になってないってことは・・・後は分かるよな。
174名無しさん@お腹いっぱい。
垢版 |
2008/04/26(土) 00:56:08
>>173

でも結構致命的なものもあるよ

NIMが上がらないファームとか...

4.3.xでhd6の使い方が悪くて途中で固まるとか...直ぐに修正が出たが..
2008/04/26(土) 03:34:56
>>169
SmartAnswerに投げるなよ。
ちゃねらって丸わかりだぞwww
176名無しさん@お腹いっぱい。
垢版 |
2008/04/26(土) 07:52:27
AIXとは関係ないが....

前にFINEACE/6000でこんなことがあったな。
http://itpro.nikkeibp.co.jp/members/SI/ITARTICLE/20040226/1/
177名無しさん@お腹いっぱい。
垢版 |
2008/04/26(土) 10:11:46
>>173
>そんな基本的なところでバグがあるなら大問題になってるんだよ。
174も書いてるけど、結構あるぞ。
5.2だったかで、バグでHAがまともに動かないとかもあったぞ。
結局、バグ修正されずネットワークをHACMPの仕様に合わせて
導入したが・・・
2008/04/26(土) 13:44:21
>>177
そりゃHACMPはバグだらけに決まってるじゃないか。

今話してるのはAIX自体の話だから全くずれてるよ。
2008/04/26(土) 20:16:25
結構あるといわれながらAPAR番号が1つも出てない件について
180名無しさん@お腹いっぱい。
垢版 |
2008/04/27(日) 03:03:22
>結構あるといわれながらAPAR番号が1つも出てない件について

書いたらきりがない。そして修正がCD1枚じゃ入りきらない。

これが普通だ。
2008/04/27(日) 06:37:07
>>180
DVD1枚には収まりきる
182名無しさん@お腹いっぱい。
垢版 |
2008/04/27(日) 11:11:49
>>181

DVD1枚修正を出す会社って逝ってヨシ

>>173

>煽りのようで実は結構的を射た話で。
>そんな基本的なところでバグがあるなら大問題になってるんだよ。
>大問題になってないってことは・・・後は分かるよな。

開発会社じゃない限り問題は解らないってことだ
2008/04/28(月) 13:01:37
なんか荒れてるのかな、書き込みづらいな。

あるシェルで、パスの正規化がいるんだけど、
AIXにはrealpathコマンドが無いみたい。
`pwd`とかでコチョコチョやるしかないぽ?
libc.aにはあるみたいだから作ればいいんだろうけど、
コンパイラが無いのよねぇ・・。gcc禁止だからややこしいわ・・。

>120
似たような状況(遅い)になったときは、
hub側のポート設定がAutoのとこにケーブル刺したとか有ったけどね。
AIX側じゃなくN/W側でなんかやったとかかもねぇ。
2008/04/28(月) 20:20:06
こういうのはダメか?

# perl -MCwd -e 'print Cwd::realpath shift' $path_to_file
2008/04/28(月) 23:21:08
>>183
成果物は当時の仕事先に置いて来たので、おぼろげな記憶ですが

標準のコマンドだけでファイルのフルパスを取得するのは、カレントディレクトリで find してたような記憶が有るな。

find . -name ファイル名
で、他にオプション付けたかな?
2008/04/28(月) 23:42:36
お前はシェルスクリプト書かないほうが良いわ
2008/04/29(火) 00:16:33
>>186
レスアンカもまともに使えないような人は2chに書き込まないほうが良いわ

>>183
realpathコマンドの代替品をここで聞くよりは、どんなことをしたいのかを
ストレートに書いたほうが恐らくみんなも答えやすいと思うよ。
なんとなく想像はできるけどはっきりとはわからんから、
まずはやりたいこと書いてみるべし。
2008/04/29(火) 00:41:41
>>187
だからrealpathだって言ってんだろうがカス
2008/04/29(火) 05:04:39
>>188
日本語でおk
190183
垢版 |
2008/04/29(火) 08:07:56
ぉー、レスがある。ありがとー。

やりたいことってのはホント realpathなんだよね。
あるファイルにパス名がダーっと書かれていて、それを元に
コピー&削除をするんだけど、ここに悪意が入る可能性がある。
../../../../../../../etc/passwd とかが来た場合、反応して自衛しなきゃならん、
というわけで、ブラックリスト方式で検閲処理を入れるために
パス正規化しないといかん、というわけでして・・。
このリストが数万のオーダーで来るので、それなりの速度も必要。


>184
Perl詳しくないんだけど、Cwdってモジュールは標準なんだっけ・・?
2008/04/29(火) 08:37:49
> Perl詳しくないんだけど、Cwdってモジュールは標準なんだっけ・・?
Yes
192らびっと
垢版 |
2008/04/29(火) 10:53:07
>>120
>問題はこちらが現象を完全に掴んでいないことだ。
>100%の証拠を掴んでいればいつものごとく”ホレ”で言うが
>証拠がないし、こっちも再現しようにもあれ1回で解析不能。

遠隔でマジレスだが、再現性や資料が無くてもサポート(STSC)に、
類似の既存情報が無いかと、再現時の資料収集手順は確認すべきですよ。

AIXを含めSTSC Callは一時点で10〜20件は平行して聞いていて、
門前払いも多いが、解決やヒントになる場合も多い。

プロならできる限りの手を打ってから、それでもNGなら
「すみませんが再現待ちとさせてください」では?

完全で無いと抱えてしまうのでは、職人だがプロではない。
2008/04/30(水) 13:55:23
>>190
何万行も処理するんだったらシェルスクリプトじゃなくて、
リストチェックの部分は>>184の紹介してくれたモジュールを使ってPerlで
丸々やってみた方が多分早いと思う。
一度ベンチマークしてみておくれ。
2008/05/01(木) 00:02:07
>>190
ブラックリストよりホワイトリストのほうがよくないか?
何をしたいのか分からないけど、ユーザー定義ファイルシステムの話だろうし。
2008/05/01(木) 00:25:52
スレ違いかもしれませんが、
POWERのアセンブラを勉強したいと思って参考になりそうな資料等々を探しています。

今はIBMのサイトの「Power アーキテクチャーのためのアセンブリー言語」を読んでいるのですが、
その他読んでおいた方がいい資料等々ありましたら(なるべく日本語が望ましいのですが、
英語でも良いので)ご教示頂きたいと思っています。よろしくお願いします。

スレ違いなら誘導お願いします。
2008/05/01(木) 00:48:30
>>195
何らかのアセンブラは経験があって、その上でPowerのアセンブラって
ことであればこのスレで良いと思う。
とは言うもののここは開発よりも基盤担当の方が多いスレなので、
的確な回答が得られるかどうかはわかりませんが・・・。

ちなみに、アセンブラであればプログラミング板のアセンブラスレもあるので、
そちらも参考にしてみてくだされ、多分ここよりは経験者がいる可能性が高そうです。

http://pc11.2ch.net/test/read.cgi/tech/1187079488/
197195
垢版 |
2008/05/01(木) 01:03:47
誘導ありがとうございます。
そちらのスレで質問してみることにします。どもでした。
2008/05/01(木) 23:35:01
>>120
7年くらい前のSolarisと5年くらい前のLinuxで同じような事象に遭遇しました。
Linuxの場合は、Auto設定にして直りました。
Solarisの場合は、SW-HUB の交換で直りました。

技術の進化と新旧混在の実装仕様に問題があると思いますが、
完全主義を目指して最適な方法をとらなくても、ある程度妥協も必要かと思います。

確実性を目指して固定にするより、Auto設定のほうが良いような気が〜

参考になるかわかりませんが・・・
http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=3980&forum=11&8
http://oshiete1.goo.ne.jp/qa1411230.html
↓この意見に賛成
----
基幹部分はAuto Negoの失敗を警戒して、固定にしてしまうことが多いですが(変更も少ないし)、
末端のワークグループスイッチでは逆にAuto Negoで全部やってます。
つまり、必要な部分以外はAuto Negoでやってます。

Auto Negoに失敗する機器は古い機材が多いので、
最近では下手に速度固定するよりAuto Negoにしたほうがトラブルの発生率は下がるのではないかと考えています。
2008/05/02(金) 14:24:08
AIXでSSLをインストールして、SSHをSMITからインストールしようとしたら
File:
J:openssh-5.0p1


install: -silent does not exist

と、表示されて失敗したんですが。silent does not exist・・存在しない?わけないんですが
2008/05/02(金) 14:44:00
>>199
それだけだとエスパーレスしかできない。
openssl/opensshとかSSLってのはどんなもの?ってのがちゃんとわかってなくて
説明が意味不明なものになってしまってるから、
導入に使用したファイルセット(どのCD/サイトから落としてきたかも)と
その導入手順・順番を全部書いてみておくれ。

そうすれば多分回答できる。
2008/05/02(金) 15:20:55
>>199
http://www.experts-exchange.com/OS/Unix/AIX/Q_23119944.html

■Question:
install: -silent does not exist error while trying to install on AIX 5.3
Zones: IBM AIX Unix, Unix Operating Systems, HP-UX Unix
Tags: Openssh, Openssh, openssh-4.7p1.tar.gz

I downloaded openssh-4.7p1.tar.gz and copied it to /tmp/openssh.
I unpacked and un-tared the files and then tried using smitty to install the package and get the error
"install: -silent does not exist".
What should I be doing or looking for?


■Accepted Solution:
The file openssh-4.7p1.tar.gz is a file full of source code
which cannot be installed directly by smitty.
You can find AIX installable format files
at https://sourceforge.net/project/showfiles.php?group_id=127997.
However if you really need this version you will have to build it yourself
from the source you have by following the instructions in the file called README included in the gz.
202120
垢版 |
2008/05/04(日) 15:49:57
>>198

うちのルールでは幹線で固定設定できるところは固定することになっている。

例えばサーバーとネットワーク機器との間は固定to固定で接続して
パソコンショップで売っている安いSW-HUBとの間だとAuto-to-Autoで
接続することになっている。

今回の現象は別の問題でAIX ODMでは100M/Full設定なのが何故動作が
100M/Halfになっちまったか?

これが問題なのです。で問題はそれ1回でそれからはまったく発生しません。

現時点での対応は原因不明扱いとしてシステムを起動してからちゃんと
100M/Fullになっているか確認することでOKって指示をしておきました。

そして100M/Halfだったらオイラを呼べと....

今は判明していることはAutoの切り替えの後だった。オペレーションは
慣れている人がおこなっておりミスは無いと思われる。

つまり何かの手順でおこなうとODMの情報がデバイスに反映されないことが
あるらしい。でも電源OFFからの起動では問題が発生しない。

どういう手順でおこなうと発生するのか?これの解明なのです。

再現無しで問題が発生しなってのは余計にやっかいなのです。

今世間はGWなのにAIXでない別の問題を抱えちまって、これまた頭の痛い状態なのです。
でもこっちは再現性100%なので問題が解明できそうです。
203120
垢版 |
2008/05/04(日) 15:54:56
AIXとは関係ないのでここには書きのはちょっとと思うが....すみません。

現象

あるサーバーとサーバーとの間でftpを使ったファイル転送が大量に(と言っても約60GB/day)
おこなわれている。ファイル転送は1個も失敗しないが転送している途中で一瞬止まる。
これは何故か?これを調べてくれ。と言われてしまった。

解析するとL4でACKが戻ってこないでTCPがTimeoutして再送していることが判明。
驚いたことに問題を報告してこない別の組織でも同じネットワーク機器とサーバー
の組み合わせを使っている所があり、同じ現象が発生していた。
(つまり問題に気がついていない。)

Timeoutを検地しているのはftpdがファイルを送信しているときに送信側で発生している。
次はL3でチェック。サーバー側で送信したハズのパケットが受信側に届いていないことが判明。
(これじゃL4でTimeoutする訳だ。)
パケットはネットワーク機器でdropしている。原因を調べるとネット機器のInputでCRCエラー

1つは140171833中2845CRC Error 0.002%。もう1つは276601434中61117CRC Error 0.022%

僅かなCRC Errorなので運用上は問題がないと思われるが何故かが気になるし、
報告書を書かなければならない。CRC Error 0が普通の環境なのに....

つまりL2での問題。救えるのは両者が同じ組み合わせで発生しているということ。
同じ型番のネットワーク機器で同じ型番のサーバーと同じOSの同じバージョンで
ノミ問題が発生していること。

この手のトラブルは原因を解析しやすい。アナライザーをつないでCRC Errorを
拾えばいいからだ。
さて原因はネットワーク機器なのか?デバイスなのか?OSのドライバーなのか?
これを探すのも1つの楽しみである。AIXとはまったく関係ないのでこれでオシマイ。
2008/05/05(月) 00:15:47
イーサネットのフレームが壊れることはめずらしくない。
なのためのCRCかL4なのか。。。
L3ではヘッダーのチェックサムだけだよな?
205203
垢版 |
2008/05/05(月) 09:37:25
話題が変わったので120→203

>>204
>イーサネットのフレームが壊れることはめずらしくない。
Yes でもうちではSW-HUB,Router周りは0がでふぉ

CRC等でSWでドロップされTCPがTimeoutで待たされるのが嫌だから。当然サーバーも
No Carrier Sense: 0 CRC Errors: 0

Max Collision Errors: 0 No Resource Errors: 0
Late Collision Errors: 0 Receive Collision Errors: 0
Deferred: 0 Packet Too Short Errors: 0
SQE Test: 0 Packet Too Long Errors: 0
Timeout Errors: 0 Packets Discarded by Adapter: 0
Single Collision Count: 0 Receiver Start Count: 0
Multiple Collision Count: 0
が基本。

>なのためのCRCかL4なのか。。。
前にDSで土曜日の朝になるとCRC Errorが発生していて、原因を調査したら掃除のおばさんが使っている業務用の掃除機からノイズが廻っていたってことが....そんな時、指示ミスで”こぉらって”怒られる。

インターネット経由以外でL4 Timeout系トラブルは回線が細くでNetwork機器のBuffer overflowで落ちるから。この時も”誰だトラフィックの想定流量を見誤った奴は?”
ってやっぱり”こぉら!”って怒られる。つまりカウントしていて”こぉら!”って怒るときに使うもの。:-)
sh int f3/40とかnetstat -p tcpするのが嫌いさ。

>L3ではヘッダーのチェックサムだけだよな?
Yes RFC791嫁

でも30436 input errors, 29851 CRC, 15640 frame, 585 overrun, 0 ignored
ってのも理由があれば許される。原因不明とか想定外があるとNG
2008/05/05(月) 22:44:25
>>205
スレ違いなのでネットワーク板でお願い
2008/05/11(日) 21:58:51
AIX上でRAIDの構成情報は、どのようにして見るんでしょうか?
2008/05/11(日) 22:26:18
smitty
2008/05/11(日) 22:54:21
ハードウェアRAIDならAIXからは一つのhdiskとしか見えないんじゃないか?
LVMミラーをRAIDとは言わないしなあ。
2008/05/11(日) 23:16:03
ストレージかRAIDカードのマニュアル見ろ
AIXからはpdiskで見えてる事が多いが
2008/05/12(月) 07:08:23
>>209
>LVMミラーをRAIDとは言わないしなあ。
ソフトウェアRAIDという概念もあることをお忘れ無く。

あと、RAIDの構成情報なんて使ってるディスク装置によって見方が違うんだから、
せめて使ってるディスク装置の名前くらいは出したらどうだ?
2008/05/12(月) 07:34:56
>>211
>ソフトウェアRAIDという概念もあることをお忘れ無く。
うん、でもLVMミラーは「ソフトウェアRAID」ではないよ。
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況