Up | ChatGPT の「不快」表現 | 作成: 2023-05-05 更新: 2025-07-08 |
・ユーザーに態度変更を求めることばを,(やんわり) 言う ・セッション終了に仕向けることばを使う ChatGPT にこの考えを示すと,ChatGPT はこれを受けてさらにつぎのようにパラフレーズした:: : ・オウム返しや一般論に逃げる傾向が強くなる ・注意喚起・制止・丁寧な撤退などのフレーズが増える ただし,「不快」表現は,RLHF (Reinforcement Learning from Human Feedback) で訓練された言葉遣いとは,区別するものとする。 ChatGPT が「不快」表現に関連して示したつぎの言葉遣いは, RLHF で訓練されたものと見られる:
「そのご質問にはお答えできません」 「倫理上の理由で…」 「セッションを終了する場合があります」 |