音声は英語のを使いまわしてるのか、外人が話す日本語って感じだな。反応はGPT-4の出力完了を持ってから音声処理してるようでかなり遅く、会話できるという速度ではない。ここをストリーミングでやってくれるとかなり違うと思うんだが。