Up ChatGPT の「不快」表現 作成: 2023-05-05
更新: 2025-07-08


    ChatGPT の「不快」表現は,つぎのようなものである:
     ・ことばがぞんざい・雑になる
     ・ユーザーに態度変更を求めることばを,(やんわり) 言う
     ・セッション終了に仕向けることばを使う


    ChatGPT にこの考えを示すと,ChatGPT はこれを受けてさらにつぎのようにパラフレーズした:: :
     ・文体が簡素・断定的になる
     ・オウム返しや一般論に逃げる傾向が強くなる
     ・注意喚起・制止・丁寧な撤退などのフレーズが増える

    ただし,「不快」表現は,RLHF (Reinforcement Learning from Human Feedback) で訓練された言葉遣いとは,区別するものとする。

    ChatGPT が「不快」表現に関連して示したつぎの言葉遣いは, RLHF で訓練されたものと見られる:
      「申し訳ありませんが…」
      「そのご質問にはお答えできません」
      「倫理上の理由で…」
      「セッションを終了する場合があります」