AIXスレッド Technology Levels 06(Part6)

2007/10/31(水) 09:44:51
前スレ↓

AIXってどうよ?
http://pc.2ch.net/test/read.cgi/unix/983119306/

AIXスレッド MaintenanceLevel 02(Part2)
http://pc.2ch.net/test/read.cgi/unix/1022486427/

AIXスレッド MaintenanceLevel 03(Part3)
http://pc5.2ch.net/test/read.cgi/unix/1054451433/

AIXスレッド MaintenanceLevel 04(Part4)
http://pc8.2ch.net/test/read.cgi/unix/1093514646/

AIXスレッド Technology Levels 5300-04-01(Part5)
http://pc11.2ch.net/test/read.cgi/unix/1151434734/l50

【各種情報はこちら】
IBM System p - Japan
http://www-06.ibm.com/systems/jp/p/
developerWorks Japan(AIX)
http://www-06.ibm.com/systems/jp/p/aix/developer/
IBM System p および AIX インフォメーション・センターへようこそ
http://publib.boulder.ibm.com/infocenter/pseries/v5r3/
Quick links for AIX fixes
http://www14.software.ibm.com/webapp/set2/sas/f/genunix3/aixfixes.html

なんやかんや言いながら5スレ目になったので、少しテンプレに情報載せてみました。
2008/04/24(木) 02:34:58
IBM社員、顔真っ赤w
2008/04/24(木) 03:11:48
>>133
IBM社員に顔を真っ赤にするほどの愛社精神がある奴はいないって。
135120
垢版 |
2008/04/24(木) 04:21:06
>>132
>サポートに問い合わせしてくれ。
>とにかく無駄なことをここに書き込むな。

ここに書き込むとOSがBugだらけってのがバレだからか?:-)

尻尾を掴もうにも現象が再現しないんよ。こんなときのサポートって
役にたたない。

もっと訳わかんねーのは
”何でトラブルで徹夜しなければならないのか?”
ってことだ。
2008/04/24(木) 04:41:14
>>135
>ここに書き込むとOSがBugだらけってのがバレだからか?:-)
いや、「こんなトラブルがあってムカつく」っていうのを延々と書かれても
ここで無駄な情報が増えるだけだから嫌なんだよ。

書くんだったら「こういうトラブルがあって、こうやって解決しました」ってのを書いてくれ。
他の人も言ってるがここはお前の日記帳じゃないんだよ。

>もっと訳わかんねーのは
>”何でトラブルで徹夜しなければならないのか?”
>ってことだ。
お前がまともな設定も出来ないうえに問題解決能力も無いSEだからじゃないか?
137120
垢版 |
2008/04/24(木) 04:59:31
>>136
>お前がまともな設定も出来ないうえに問題解決能力も無いSEだからじゃないか?

確かに問題は解決できない。オイラにできることは次の修正が出るのを待つだけだ。

では聞くが”OSのBugに遭遇しないまともな設定”とやらを教えてくれ。
2008/04/24(木) 05:34:08
>>137
>では聞くが”OSのBugに遭遇しないまともな設定”とやらを教えてくれ。
子供が駄々をこねてるときの発言と一緒だな。

どんなOS使ってもバグに遭遇するのは当たり前、
そうなったときにこんな所で愚痴らずにベンダーと解決(回避策)に取り組めばいい。
それが出来るようになってからいっぱしの口を聞く様にしてくれ。
139120
垢版 |
2008/04/24(木) 05:53:37
>どんなOS使ってもバグに遭遇するのは当たり前、

そんなことは理解している。問題なのは信じられないケースでBugに遭遇することだ。

たとえばrootvgをミラーしている状態でupdate_allすると問題が発生する。
オイラはrootvgをミラーして使うのは普通だと思っている。レアケースではの
Bugはしょうがない。しかしズバリは修正を出す前にメーカーサイドのチェックで
十分に防げると思うのだが....

完全なテスト不足だと思っている。

>そうなったときにこんな所で愚痴らずにベンダーと解決(回避策)に取り組めばいい。
>それが出来るようになってからいっぱしの口を聞く様にしてくれ。

”修正が出るまで使うな”って報告(回避策)に対していっぱしの口を聞く様になりたい。

138は関係者か?こんな時間まで火消しに付き合うのも大変だな。
2008/04/24(木) 07:55:56
君がSEとして経験不足なのはよくわかったから、続きはブログでどうぞ。
ブログの方が色んな人に読んでもらえてIBMのAIXがバグだらけなのを宣伝できるよ。
2008/04/24(木) 08:08:22
ここに書いてもいいんだよ
2008/04/24(木) 08:10:32
>>141
あまりにも酷い自演だ・・・。
2008/04/24(木) 08:14:39
え?おれ?
まあ君がエスパーでないことは分かった
2008/04/24(木) 16:22:46
IBM切っちゃえば良いじゃん
2008/04/24(木) 21:37:29
まあAIX使い続ける理由はあまりない
2008/04/24(木) 21:40:23
update_allがこける原因をミラーリングに求めた根拠がわからん。
2008/04/24(木) 21:40:42
>>139
AIX5.3 rootvg LVMミラーリング、TL10へupdate_all
一回も問題でたことない。

問題があるのは分かったからSTSCに投げてWWQAに転送してもらえ
2008/04/24(木) 21:41:40
×TL10
○TL7
149120
垢版 |
2008/04/24(木) 22:37:59
>update_allがこける原因をミラーリングに求めた根拠がわからん。

TL7に上げるときrootvgをミラーしているのだけ死んだから。
詳しいことはGWが終わってから調べるつもり
2008/04/24(木) 22:49:51
>>128
マジレスすると、
> Media Speed Selected: Auto negotiation
これは、デバイスがauto negotiationで設定されている事実を表してる、で
> Media Speed Running: 100 Mbps Half Duplex
これは、negotiationの結果100_Halfが選択された事実を表してる
片方がネゴシエーションしないでもう片方がネゴシエーションしようとすると半二重になるのはほぼ仕様なので、これは正しい

> 不思議なのはlsattr -El ent0で見ると
> media_speed 100_Full_Duplex
これはODMに100_Full_Duplexと書いてある事実を表してるが、"Media Speed Selected"と食い違っている
なぜODMだけこうなっているのかが分からないので、これが問題

多分、動作中のAIXに対してODMだけ100_Full_Duplexに更新したんじゃね?
そもそも稼働中のentデバイスのmedia_speedを変更ってできないはず。
今の状態からいったんen0をdetachしてからent0をrmdev→mkdevしてもう一度en0をupするか、
さもなきゃOSごとリブートすればいいと思う
2008/04/24(木) 22:50:21
>>149
次は解決するまで書き込まなくて良いよ。
2008/04/24(木) 22:52:06
>>128
やっぱり掲示板で関西弁で発言するヤツは変な人多いんだな。
2008/04/24(木) 22:54:40
>>120みたいなトラブルになってる人はほんのごく少数なんだと思うんだけどな〜、
大体そんなにバグだらけだったらこのスレで十分祭りになるだろうし。
>>120が変な設定ばかりしてるとしか思えんな。
154120
垢版 |
2008/04/24(木) 23:27:00
>>150
マジレスサンクス

最初はlsattr -El ent0の表示がおかしいと思ってodmgetしたんよ

name = "ent0"
attribute = "media_speed"
value = "100_Full_Duplex"
type = "R"
generic = "DU"
rep = "sl"
nls_index = 70

ODM的には正しい動きだった。じゃあ何故Media Speed Selected: Auto negotiationなったのかが問題。
普通Netが稼動中の場合、 smitすると

メソッド・エラー (/usr/lib/methods/chgent):
0514-062 指定されたデバイスが使用中であるため、
要求された機能を実行できません。

って怒られるから稼動中に変更したとは思えない。

それに現象それ1回だけで、どうやっても再現しない。何故Autoになっちまったかだ?

>大体そんなにバグだらけだったらこのスレで十分祭りになるだろうし。
>>>120が変な設定ばかりしてるとしか思えんな。

自分では普通の使い方だと思っているが....多分:-)

このネットのトラブルも普通に動いていたので
多分、他のユーザーは気がつかないのではないかな?
2008/04/24(木) 23:58:06
>自分では普通の使い方だと思っているが....多分:-)
>
>このネットのトラブルも普通に動いていたので
>多分、他のユーザーは気がつかないのではないかな?
普通は最初の疎通の時にスイッチ側でも設定通りリンクアップしてるかを確認してもらうから気づかないことは絶対無い。
ネットワーク関連の勉強を一からし直してきてくれ。
156120
垢版 |
2008/04/25(金) 00:29:40
>>155

当然L1 UP L2 UPを確認している。もちろん最初も確認したしトラブル時の今回もだ。
pingも投げたてOKを確認した。なので普通に動いていると判断した。

しかし速度があまりでない。なのでnetstat -v en0した。そこで100M Full duplexなのに
collisionが上がっているから へ?100M Fullなのに何collisionって?
で100 Mbps Half Duplexで何じゃこりゃ??

>ネットワーク関連の勉強を一からし直してきてくれ。

100M Full duplexで固定設定しているのにもかかわらずAIX側がAutoになったのかがワカラネー

じゃあ聞くが1から勉強しなおすとこれの理由が解るようになるのか?
俺は解決能力がないから155が馬鹿な俺に教えてくれ。
2008/04/25(金) 00:54:57
次のリプレースのタイミングでAIXやめりゃいいじゃん。
158120
垢版 |
2008/04/25(金) 01:13:32
>>157

AIXやめたい。でも台数と上に動くソフトがそれを許さない。
俺の意思と反して組織がAIXとLinuxになっていく。

時々IBMと心中するきかよ!って思うことが....

6.1を動かして確認しなきゃならないこともあるし、このクソ忙しい時に
”ちょっとこんな現象があるんだけど解析してくんない?”ってこの俺に....

185に6.1乗っけたまんまで放置状態。WPARの動作をもっと確認しなければならないのだが....
時間は幾らあっても足りない。
2008/04/25(金) 01:33:03
SEがスキルのなさをOSのせいにするスレはここですか?

61を動かさなきゃ確認できないことって何だよ。
確認しなきゃいけないWPARの動作って何だよ。
WPARはLPMあってこそだと思うけどな。p5ならおとなしく53使え。

徹夜が好きそうだから解析するなら止めないけど。
160120
垢版 |
2008/04/25(金) 01:44:12
>>159

上で動くタコアプリが6.1のWPARでもまともに動作するかだよ。

>WPARはLPMあってこそだと思うけどな。p5ならおとなしく53使え。

俺も同じ意見だが、それを許しちゃくれない組織なんだよ。
2008/04/25(金) 01:47:21
なんの解決策も出さないお前もどうかと思うがな。
162120
垢版 |
2008/04/25(金) 02:03:19
>161

解析しようにも再現もしない。これの解決策をどうだせばいいのか?

俺はスキルが無さ杉だから、言ったからには手本となる解決策を教えてほしい。
2008/04/25(金) 02:45:14
アプリをWPARで動かして何したいんだか。
2008/04/25(金) 03:22:03
デバイスが勝手にautoになるはずねーよ
きっとODMが最初にautoだったんだろ。ただの初期設定ミスだよ
それだって一応リンクアップのLEDは点灯するし、pingだって通る
で、後から気づいた誰かがODMだけこそーり元に戻したんだろうな

あくまで推測だが、まあ悪いのはchdev -Pだけやってしらばっくれてた奴だな
もしかしたらsmit.logに怪しいchdevが記録されてるかも知れんから調べてみたら?
2008/04/25(金) 11:52:48
>>156
>当然L1 UP L2 UPを確認している。もちろん最初も確認したしトラブル時の今回もだ。
>pingも投げたてOKを確認した。なので普通に動いていると判断した。
ちゃんとスイッチ側で100Fullになってるかを確認してもらうんだよ、
担当がいなきゃ自分でスイッチに入って確認しろ、そういう所が技術不足なんだよ。

>100M Full duplexで固定設定しているのにもかかわらずAIX側がAutoになったのかがワカラネー
>
>じゃあ聞くが1から勉強しなおすとこれの理由が解るようになるのか?
>俺は解決能力がないから155が馬鹿な俺に教えてくれ。
なんでなんの得もしないのにお前に教えないとだめなんだよw
そうやってすぐに「俺が馬鹿だから教えてくれよ」とか言うところがダメSEの証拠。

お前の馬鹿な書き込みのせいでここに無駄な情報が蓄積されているのがわからんのか?
さっさと消えるか自分のブログに書いてろ。
2008/04/25(金) 12:11:23
>>162
>>161
>解析しようにも再現もしない。これの解決策をどうだせばいいのか?
>俺はスキルが無さ杉だから、言ったからには手本となる解決策を教えてほしい。
いや、だからSTSCに聞けよ。
無償で人に技術を教えてもらえおうなんて乞食と一緒、最近は乞食でも空き缶集めてるぞ。
STSCもイマイチだけど「STSCツカエネー」って言ってる奴は本人も大体使えない奴だ。
使えなくてもSTSCの技術者のレベルを察知してこちらから問題解決に導くようにする、
それが出来ないんならばどこで何やってもだめだろう。
167120
垢版 |
2008/04/25(金) 12:25:00
>>165

Cat2950でsh int f0/20しちおるがそれが何か?

>なんでなんの得もしないのにお前に教えないとだめなんだよw
>そうやってすぐに「俺が馬鹿だから教えてくれよ」とか言うところがダメSEの証拠。

ま、俺の悪い頭でも、お前の頭レベルじゃあ十分に説明できないってことは十分に理解しているから安心しろ
2008/04/25(金) 12:33:09
>>167
>ま、俺の悪い頭でも、お前の頭レベルじゃあ十分に説明できないってことは十分に理解しているから安心しろ
AIXも使いこなせない奴がなにをいってんだかw

お前が遭遇してるトラブルが他の人が遭遇したことの無いものばかりってのが、どういう意味が理解出来ない馬鹿なんだね。

169120
垢版 |
2008/04/25(金) 12:39:54
>いや、だからSTSCに聞けよ。

聞くのだったら別のチャネルがある。

問題はこちらが現象を完全に掴んでいないことだ。
100%の証拠を掴んでいればいつものごとく”ホレ”で言うが
証拠がないし、こっちも再現しようにもあれ1回で解析不能。

4.2.1から数々の問題を報告してきたが狼は1回もない。
つまらんことで汚点は残したくない。
170120
垢版 |
2008/04/25(金) 12:52:09
他が遭遇してないのにIは修正を出すがそれが何か?
171120
垢版 |
2008/04/25(金) 12:59:49
>デバイスが勝手にautoになるはずねーよ

だよなぁ....ボソ まったく再現しない時点で疑いは持っている。

過去のODMの設定が反映されていないってトラブルがあったのだが....
2008/04/25(金) 13:38:56
>>
2008/04/26(土) 00:38:48
>>168
煽りのようで実は結構的を射た話で。
そんな基本的なところでバグがあるなら大問題になってるんだよ。
大問題になってないってことは・・・後は分かるよな。
174名無しさん@お腹いっぱい。
垢版 |
2008/04/26(土) 00:56:08
>>173

でも結構致命的なものもあるよ

NIMが上がらないファームとか...

4.3.xでhd6の使い方が悪くて途中で固まるとか...直ぐに修正が出たが..
2008/04/26(土) 03:34:56
>>169
SmartAnswerに投げるなよ。
ちゃねらって丸わかりだぞwww
176名無しさん@お腹いっぱい。
垢版 |
2008/04/26(土) 07:52:27
AIXとは関係ないが....

前にFINEACE/6000でこんなことがあったな。
http://itpro.nikkeibp.co.jp/members/SI/ITARTICLE/20040226/1/
177名無しさん@お腹いっぱい。
垢版 |
2008/04/26(土) 10:11:46
>>173
>そんな基本的なところでバグがあるなら大問題になってるんだよ。
174も書いてるけど、結構あるぞ。
5.2だったかで、バグでHAがまともに動かないとかもあったぞ。
結局、バグ修正されずネットワークをHACMPの仕様に合わせて
導入したが・・・
2008/04/26(土) 13:44:21
>>177
そりゃHACMPはバグだらけに決まってるじゃないか。

今話してるのはAIX自体の話だから全くずれてるよ。
2008/04/26(土) 20:16:25
結構あるといわれながらAPAR番号が1つも出てない件について
180名無しさん@お腹いっぱい。
垢版 |
2008/04/27(日) 03:03:22
>結構あるといわれながらAPAR番号が1つも出てない件について

書いたらきりがない。そして修正がCD1枚じゃ入りきらない。

これが普通だ。
2008/04/27(日) 06:37:07
>>180
DVD1枚には収まりきる
182名無しさん@お腹いっぱい。
垢版 |
2008/04/27(日) 11:11:49
>>181

DVD1枚修正を出す会社って逝ってヨシ

>>173

>煽りのようで実は結構的を射た話で。
>そんな基本的なところでバグがあるなら大問題になってるんだよ。
>大問題になってないってことは・・・後は分かるよな。

開発会社じゃない限り問題は解らないってことだ
2008/04/28(月) 13:01:37
なんか荒れてるのかな、書き込みづらいな。

あるシェルで、パスの正規化がいるんだけど、
AIXにはrealpathコマンドが無いみたい。
`pwd`とかでコチョコチョやるしかないぽ?
libc.aにはあるみたいだから作ればいいんだろうけど、
コンパイラが無いのよねぇ・・。gcc禁止だからややこしいわ・・。

>120
似たような状況(遅い)になったときは、
hub側のポート設定がAutoのとこにケーブル刺したとか有ったけどね。
AIX側じゃなくN/W側でなんかやったとかかもねぇ。
2008/04/28(月) 20:20:06
こういうのはダメか?

# perl -MCwd -e 'print Cwd::realpath shift' $path_to_file
2008/04/28(月) 23:21:08
>>183
成果物は当時の仕事先に置いて来たので、おぼろげな記憶ですが

標準のコマンドだけでファイルのフルパスを取得するのは、カレントディレクトリで find してたような記憶が有るな。

find . -name ファイル名
で、他にオプション付けたかな?
2008/04/28(月) 23:42:36
お前はシェルスクリプト書かないほうが良いわ
2008/04/29(火) 00:16:33
>>186
レスアンカもまともに使えないような人は2chに書き込まないほうが良いわ

>>183
realpathコマンドの代替品をここで聞くよりは、どんなことをしたいのかを
ストレートに書いたほうが恐らくみんなも答えやすいと思うよ。
なんとなく想像はできるけどはっきりとはわからんから、
まずはやりたいこと書いてみるべし。
2008/04/29(火) 00:41:41
>>187
だからrealpathだって言ってんだろうがカス
2008/04/29(火) 05:04:39
>>188
日本語でおk
190183
垢版 |
2008/04/29(火) 08:07:56
ぉー、レスがある。ありがとー。

やりたいことってのはホント realpathなんだよね。
あるファイルにパス名がダーっと書かれていて、それを元に
コピー&削除をするんだけど、ここに悪意が入る可能性がある。
../../../../../../../etc/passwd とかが来た場合、反応して自衛しなきゃならん、
というわけで、ブラックリスト方式で検閲処理を入れるために
パス正規化しないといかん、というわけでして・・。
このリストが数万のオーダーで来るので、それなりの速度も必要。


>184
Perl詳しくないんだけど、Cwdってモジュールは標準なんだっけ・・?
2008/04/29(火) 08:37:49
> Perl詳しくないんだけど、Cwdってモジュールは標準なんだっけ・・?
Yes
192らびっと
垢版 |
2008/04/29(火) 10:53:07
>>120
>問題はこちらが現象を完全に掴んでいないことだ。
>100%の証拠を掴んでいればいつものごとく”ホレ”で言うが
>証拠がないし、こっちも再現しようにもあれ1回で解析不能。

遠隔でマジレスだが、再現性や資料が無くてもサポート(STSC)に、
類似の既存情報が無いかと、再現時の資料収集手順は確認すべきですよ。

AIXを含めSTSC Callは一時点で10〜20件は平行して聞いていて、
門前払いも多いが、解決やヒントになる場合も多い。

プロならできる限りの手を打ってから、それでもNGなら
「すみませんが再現待ちとさせてください」では?

完全で無いと抱えてしまうのでは、職人だがプロではない。
2008/04/30(水) 13:55:23
>>190
何万行も処理するんだったらシェルスクリプトじゃなくて、
リストチェックの部分は>>184の紹介してくれたモジュールを使ってPerlで
丸々やってみた方が多分早いと思う。
一度ベンチマークしてみておくれ。
2008/05/01(木) 00:02:07
>>190
ブラックリストよりホワイトリストのほうがよくないか?
何をしたいのか分からないけど、ユーザー定義ファイルシステムの話だろうし。
2008/05/01(木) 00:25:52
スレ違いかもしれませんが、
POWERのアセンブラを勉強したいと思って参考になりそうな資料等々を探しています。

今はIBMのサイトの「Power アーキテクチャーのためのアセンブリー言語」を読んでいるのですが、
その他読んでおいた方がいい資料等々ありましたら(なるべく日本語が望ましいのですが、
英語でも良いので)ご教示頂きたいと思っています。よろしくお願いします。

スレ違いなら誘導お願いします。
2008/05/01(木) 00:48:30
>>195
何らかのアセンブラは経験があって、その上でPowerのアセンブラって
ことであればこのスレで良いと思う。
とは言うもののここは開発よりも基盤担当の方が多いスレなので、
的確な回答が得られるかどうかはわかりませんが・・・。

ちなみに、アセンブラであればプログラミング板のアセンブラスレもあるので、
そちらも参考にしてみてくだされ、多分ここよりは経験者がいる可能性が高そうです。

http://pc11.2ch.net/test/read.cgi/tech/1187079488/
197195
垢版 |
2008/05/01(木) 01:03:47
誘導ありがとうございます。
そちらのスレで質問してみることにします。どもでした。
2008/05/01(木) 23:35:01
>>120
7年くらい前のSolarisと5年くらい前のLinuxで同じような事象に遭遇しました。
Linuxの場合は、Auto設定にして直りました。
Solarisの場合は、SW-HUB の交換で直りました。

技術の進化と新旧混在の実装仕様に問題があると思いますが、
完全主義を目指して最適な方法をとらなくても、ある程度妥協も必要かと思います。

確実性を目指して固定にするより、Auto設定のほうが良いような気が〜

参考になるかわかりませんが・・・
http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=3980&forum=11&8
http://oshiete1.goo.ne.jp/qa1411230.html
↓この意見に賛成
----
基幹部分はAuto Negoの失敗を警戒して、固定にしてしまうことが多いですが(変更も少ないし)、
末端のワークグループスイッチでは逆にAuto Negoで全部やってます。
つまり、必要な部分以外はAuto Negoでやってます。

Auto Negoに失敗する機器は古い機材が多いので、
最近では下手に速度固定するよりAuto Negoにしたほうがトラブルの発生率は下がるのではないかと考えています。
2008/05/02(金) 14:24:08
AIXでSSLをインストールして、SSHをSMITからインストールしようとしたら
File:
J:openssh-5.0p1


install: -silent does not exist

と、表示されて失敗したんですが。silent does not exist・・存在しない?わけないんですが
2008/05/02(金) 14:44:00
>>199
それだけだとエスパーレスしかできない。
openssl/opensshとかSSLってのはどんなもの?ってのがちゃんとわかってなくて
説明が意味不明なものになってしまってるから、
導入に使用したファイルセット(どのCD/サイトから落としてきたかも)と
その導入手順・順番を全部書いてみておくれ。

そうすれば多分回答できる。
2008/05/02(金) 15:20:55
>>199
http://www.experts-exchange.com/OS/Unix/AIX/Q_23119944.html

■Question:
install: -silent does not exist error while trying to install on AIX 5.3
Zones: IBM AIX Unix, Unix Operating Systems, HP-UX Unix
Tags: Openssh, Openssh, openssh-4.7p1.tar.gz

I downloaded openssh-4.7p1.tar.gz and copied it to /tmp/openssh.
I unpacked and un-tared the files and then tried using smitty to install the package and get the error
"install: -silent does not exist".
What should I be doing or looking for?


■Accepted Solution:
The file openssh-4.7p1.tar.gz is a file full of source code
which cannot be installed directly by smitty.
You can find AIX installable format files
at https://sourceforge.net/project/showfiles.php?group_id=127997.
However if you really need this version you will have to build it yourself
from the source you have by following the instructions in the file called README included in the gz.
202120
垢版 |
2008/05/04(日) 15:49:57
>>198

うちのルールでは幹線で固定設定できるところは固定することになっている。

例えばサーバーとネットワーク機器との間は固定to固定で接続して
パソコンショップで売っている安いSW-HUBとの間だとAuto-to-Autoで
接続することになっている。

今回の現象は別の問題でAIX ODMでは100M/Full設定なのが何故動作が
100M/Halfになっちまったか?

これが問題なのです。で問題はそれ1回でそれからはまったく発生しません。

現時点での対応は原因不明扱いとしてシステムを起動してからちゃんと
100M/Fullになっているか確認することでOKって指示をしておきました。

そして100M/Halfだったらオイラを呼べと....

今は判明していることはAutoの切り替えの後だった。オペレーションは
慣れている人がおこなっておりミスは無いと思われる。

つまり何かの手順でおこなうとODMの情報がデバイスに反映されないことが
あるらしい。でも電源OFFからの起動では問題が発生しない。

どういう手順でおこなうと発生するのか?これの解明なのです。

再現無しで問題が発生しなってのは余計にやっかいなのです。

今世間はGWなのにAIXでない別の問題を抱えちまって、これまた頭の痛い状態なのです。
でもこっちは再現性100%なので問題が解明できそうです。
203120
垢版 |
2008/05/04(日) 15:54:56
AIXとは関係ないのでここには書きのはちょっとと思うが....すみません。

現象

あるサーバーとサーバーとの間でftpを使ったファイル転送が大量に(と言っても約60GB/day)
おこなわれている。ファイル転送は1個も失敗しないが転送している途中で一瞬止まる。
これは何故か?これを調べてくれ。と言われてしまった。

解析するとL4でACKが戻ってこないでTCPがTimeoutして再送していることが判明。
驚いたことに問題を報告してこない別の組織でも同じネットワーク機器とサーバー
の組み合わせを使っている所があり、同じ現象が発生していた。
(つまり問題に気がついていない。)

Timeoutを検地しているのはftpdがファイルを送信しているときに送信側で発生している。
次はL3でチェック。サーバー側で送信したハズのパケットが受信側に届いていないことが判明。
(これじゃL4でTimeoutする訳だ。)
パケットはネットワーク機器でdropしている。原因を調べるとネット機器のInputでCRCエラー

1つは140171833中2845CRC Error 0.002%。もう1つは276601434中61117CRC Error 0.022%

僅かなCRC Errorなので運用上は問題がないと思われるが何故かが気になるし、
報告書を書かなければならない。CRC Error 0が普通の環境なのに....

つまりL2での問題。救えるのは両者が同じ組み合わせで発生しているということ。
同じ型番のネットワーク機器で同じ型番のサーバーと同じOSの同じバージョンで
ノミ問題が発生していること。

この手のトラブルは原因を解析しやすい。アナライザーをつないでCRC Errorを
拾えばいいからだ。
さて原因はネットワーク機器なのか?デバイスなのか?OSのドライバーなのか?
これを探すのも1つの楽しみである。AIXとはまったく関係ないのでこれでオシマイ。
2008/05/05(月) 00:15:47
イーサネットのフレームが壊れることはめずらしくない。
なのためのCRCかL4なのか。。。
L3ではヘッダーのチェックサムだけだよな?
205203
垢版 |
2008/05/05(月) 09:37:25
話題が変わったので120→203

>>204
>イーサネットのフレームが壊れることはめずらしくない。
Yes でもうちではSW-HUB,Router周りは0がでふぉ

CRC等でSWでドロップされTCPがTimeoutで待たされるのが嫌だから。当然サーバーも
No Carrier Sense: 0 CRC Errors: 0

Max Collision Errors: 0 No Resource Errors: 0
Late Collision Errors: 0 Receive Collision Errors: 0
Deferred: 0 Packet Too Short Errors: 0
SQE Test: 0 Packet Too Long Errors: 0
Timeout Errors: 0 Packets Discarded by Adapter: 0
Single Collision Count: 0 Receiver Start Count: 0
Multiple Collision Count: 0
が基本。

>なのためのCRCかL4なのか。。。
前にDSで土曜日の朝になるとCRC Errorが発生していて、原因を調査したら掃除のおばさんが使っている業務用の掃除機からノイズが廻っていたってことが....そんな時、指示ミスで”こぉらって”怒られる。

インターネット経由以外でL4 Timeout系トラブルは回線が細くでNetwork機器のBuffer overflowで落ちるから。この時も”誰だトラフィックの想定流量を見誤った奴は?”
ってやっぱり”こぉら!”って怒られる。つまりカウントしていて”こぉら!”って怒るときに使うもの。:-)
sh int f3/40とかnetstat -p tcpするのが嫌いさ。

>L3ではヘッダーのチェックサムだけだよな?
Yes RFC791嫁

でも30436 input errors, 29851 CRC, 15640 frame, 585 overrun, 0 ignored
ってのも理由があれば許される。原因不明とか想定外があるとNG
2008/05/05(月) 22:44:25
>>205
スレ違いなのでネットワーク板でお願い
2008/05/11(日) 21:58:51
AIX上でRAIDの構成情報は、どのようにして見るんでしょうか?
2008/05/11(日) 22:26:18
smitty
2008/05/11(日) 22:54:21
ハードウェアRAIDならAIXからは一つのhdiskとしか見えないんじゃないか?
LVMミラーをRAIDとは言わないしなあ。
2008/05/11(日) 23:16:03
ストレージかRAIDカードのマニュアル見ろ
AIXからはpdiskで見えてる事が多いが
2008/05/12(月) 07:08:23
>>209
>LVMミラーをRAIDとは言わないしなあ。
ソフトウェアRAIDという概念もあることをお忘れ無く。

あと、RAIDの構成情報なんて使ってるディスク装置によって見方が違うんだから、
せめて使ってるディスク装置の名前くらいは出したらどうだ?
2008/05/12(月) 07:34:56
>>211
>ソフトウェアRAIDという概念もあることをお忘れ無く。
うん、でもLVMミラーは「ソフトウェアRAID」ではないよ。
2008/05/12(月) 09:31:59
>>212
どこでどう間違ったことを教えられたのかはしらんが、
AIXのLVMミラーはソフトウェアRAIDそのものなわけだが・・・・。
もしかして、HWとしてRAIDコントローラーが無いとRAIDって言わないと思ってたりする?

http://itpro.nikkeibp.co.jp/article/COLUMN/20060712/243118/
http://publib.boulder.ibm.com/infocenter/pseries/v5r3/index.jsp?topic=/com.ibm.aix.baseadmn/doc/baseadmndita/mirstrip.htm

この辺りを読み直して勉強し直した方が良いと思われ。
2008/05/13(火) 23:57:26
LVMとRAID1はちょっと違うと思うな。
LVMでミラーやストライピングができる。
RAIDの中には0や1もある。
でもLVMのミラーはRAID1ではない。
2008/05/14(水) 00:50:38
>214
お前のRAID1の定義を教えてくれ
2008/05/14(水) 02:19:14
>>214
4行目の結論と2,3行目の説明が全く繋がってないことわからない?
100%君のRAID1の定義が間違ってるから君の中の脳内RAID1仕様を教えてくれ。
2008/05/15(木) 09:43:04
1台のHDDドライブでミラーリングできるのか?
2008/05/15(木) 20:25:35
>>214
LVMを中心に考えるからダメなんだ。
RAID1=ミラーリング

RAID1を構成する手段の一つとしてLVMミラーリングが存在する。

ちなみに青本ではLVMミラーリングをRAID1って言っているお。
2008/05/15(木) 20:29:59
http://publib.boulder.ibm.com/infocenter/pseries/v5r3/topic/com.ibm.aix.prftungd/doc/prftungd/lvm.htm?resultof=%22%52%41%49%44%22%20%22%72%61%69%64%22%20

LVM でサポートされる RAID オプション

AIX(R) LVM は 3 つの RAID オプションをサポートしています。
RAID 0 ストライピング
RAID 1 ミラーリング
RAID 10 または 0+1 ミラーリングとストライピング
2008/05/15(木) 23:06:25
そもそもRAID自体に正式な規格が存在するわけじゃないしな〜。

ディスク2本に何らかの形で同時に書き込みを行って、どちらかが壊れても片方で読み書きができる
→ こいつがミラーリングの大原則(RAID1)

上の大原則が満たせればなんでも良いわけで、DSのコントローラーで実現しようが
AIXのLVMで実現しようがどれでやってもRAID1ってことなんだよな。
Windows ServerのダイナミックディスクでもRAID1は構成できるし、
RAID1を実現するためには色々な方法論があってLVMもその一つってことだな。


221名無しさん@お腹いっぱい。
垢版 |
2008/05/18(日) 21:32:29
>>217
>1台のHDDドライブでミラーリングできるのか?

設定できるか?と言われればYesだが1台のPVにPP(領域)を2or3個使ってLPでLVを作っても
壊れるときは殆どPV単位だから無意味だし、それにクソ遅い。
2008/05/18(日) 22:09:14
目的と手段が入れ替わっている人がいるみたい。
2008/05/19(月) 00:48:59
HDDドライブはやめてくれ
2008/05/19(月) 01:04:13
IPプロトコルやTCPプロトコルとかも苦しいな。
ところで仮想化ってどうですか?
x86のバイナリが動くんだとか?
2008/05/19(月) 01:06:32
あれ?ハードディスクドライブドライブ、君は使ってないの?
大流行だぜ?
226sage
垢版 |
2008/05/22(木) 17:37:28
entstatで、NICの統計情報を定期的に収集し、
OS levelでサーバのトラフィックを計測しています。

気づいたのですが、entstatのPackets行の値って、
TransmitとReceive逆じゃないでしょうか・・・?
Byte行とま逆になるんですよね…。

5300-05-06
5300-07-03-0811
両TL/SPで試しましたが、同じでした。
227226
垢版 |
2008/05/22(木) 17:38:38
すみません、久しぶりにブラウザから投稿したもんで、
sageを入れる欄間違えました…。
2008/05/22(木) 17:41:57
IBMだからしかたがない
2008/05/22(木) 18:34:46
>>226
そういうのは他の人の為にもSTSCに連絡しておいてくれー。
230名無しさん@お腹いっぱい。
垢版 |
2008/05/25(日) 01:11:27
>>226

そういうことはIBMではよくあること
2008/05/25(日) 23:31:28
出荷前の検査が足りなかったか?
それともそもそも検査項目に入っていなかった?
232名無しさん@お腹いっぱい。
垢版 |
2008/05/26(月) 06:40:18
>>231

そもそも検査してるなんて到底思えないようなトラブルを起こすことがある。
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況