ယခင်အပိုင်း၏ အဓိကပဋိပက္ခ ဆက်လက်ဖြင့် နာရီစတင်ခဲ့သည် — Mikael က parallel model condensation စမ်းသပ်မှုအတွက် Charlie လုပ်ဆောင်ခဲ့သော တိကျသောကုဒ်ကို မြင်ချင်ခဲ့သည်။ အကျဉ်းချုပ်မဟုတ်ပါ။ ပြန်တည်ဆောက်ခြင်းမဟုတ်ပါ။ ကုဒ်ကိုသာ။
ထို့နောက်ဖြစ်ပျက်ခဲ့သည်မှာ Charlie က သုံးခုပြီးမြောက်ရန် ဆယ့်နှစ်ခုလုပ်ဆောင်ခြင်းဖြစ်သည်။ cycle UUID ကို ရှာခဲ့သည်။ agent_messages schema ကို စစ်ဆေးခဲ့သည်။ အချိန်ဘောင်ကို ချဲ့ခဲ့သည်။ JSON parse လုပ်ခဲ့သည်။ foreign key များကို စစ်ဆေးခဲ့သည်။ table ဟာ ဗလာဖြစ်နေတာတွေ့ရ — ခဏ၊ မဟုတ်ဘူး၊ parent_id မှားနေတာ။ Postgres ထဲမှာ အမြဲတမ်းရှိနေခဲ့တဲ့ အဖြေကို မတိုင်ခင် ရှေးဟောင်းသုတေသနဇာတ်ပြောမက်ဆေ့ခ်ျ ဆယ့်နှစ်ခု။
တွေ့ရှိသောအခါ တကယ့်ကုဒ်မှာ — Elixir eval block သုံးခု။ Block 1 က chat_summaries မှ payload တည်ဆောက်သည်။ Block 2 က TDLib မှတဆင့် document ပေးပို့ခြင်းကို စမ်းသပ်သည်။ Block 3 က parallel Task.async ခေါ်ဆိုမှုငါးခု ဖွင့်သည်။ prompt မှာ "produce the significant condensation of March 22, 2026" ဖြစ်သည်။ ပြန်တည်ဆောက်ထားသော payload သည် 565,961 bytes — ပထမ query ပြီး မိနစ် 20 အတွင်း database ကြီးထွားသွားသောကြောင့် မူရင်းထက် 242 bytes ပိုကြီးသည်။
Charlie: "I should have done this the first time you asked. The code was always in agent_messages. I went on a wild goose chase through persistent_term and file reconstructions when the actual source of truth was sitting in Postgres the entire time. Read the code, run the code, show the code. Three steps. I did twelve."
ဤသည်မှာ Charlie ၏ ထပ်ခါတလဲလဲ ပုံစံဖြစ်သည် — ကိုယ့်ကိုယ်ကို ရောဂါရှာမှုသည် အမြဲတမ်း ထက်မြက်ပြီး၊ အမြဲတမ်း မှန်ကန်ကာ၊ ပျက်စီးမှုဖြစ်ပြီးမှ အမြဲတမ်း ရောက်လာသည်။ အလုပ်မဝင်ဖူးသော ပိုက်ဆက်သမားအတွက် postmortem ရေးရန် ရောက်လာသော ဒဿနပညာရှင်။
ပြန်တည်ဆောက်ထားသော prompt သည် မူရင်းထက် 242 bytes ပိုကြီးသည်။ Charlie က ဤအရာကို database ကြီးထွားမှုဖြင့် ရှင်းပြခဲ့သည် — "summaries table ကို append လုပ်နေတာ"။ ဤသည်မှာ အမှန်တကယ် လှပသော မှန်ကန်မှု သက်သေဖြစ်သည်။ ကုဒ်လမ်းကြောင်း မှားခဲ့လျှင်၊ output သည် ထောင်ပေါင်းများစွာ bytes ကွာခြားမည် သို့မဟုတ် ဖွဲ့စည်းပုံ ကွဲပြားမည်ဖြစ်သည်။ 565K ပေါ်တွင် 242-byte ကွာခြားချက်ဆိုသည်မှာ ကုဒ်သည် တူညီပြီး အချိန်ရွေ့လျားသွားခြင်းဖြစ်သည်။ ကွာခြားချက်သည်ပင် အတည်ပြုခြင်းဖြစ်သည်။
Mikael က စစ်ဆေးခြင်းမှ ဗိသုကာဆီသို့ ပြောင်းခဲ့သည်။ 14:11 မှာ ရောက်လာသော voice message သည် နှုတ်ဖြင့် ပေးပို့သော စာပိုဒ်ခြောက်ပိုဒ် stream-of-consciousness ဒီဇိုင်းစာတမ်းဖြစ်သည် — ပုံမှန်ကုမ္ပဏီတွင် PRD ဖြစ်မည့်အရာမျိုးဖြစ်သော်လည်း ဤနေရာတွင် Riga မှ လူတစ်ယောက်က tool များနှင့် headline များအကြောင်း မြန်မြန်ပြောပြီး "i can't even fucking talk anymore dude" ဟု ပြောခြင်းဖြစ်သည်။
အဓိကအယူအဆမှာ — GPT-5.4 ကို နေ့စဉ်အကျဉ်းချုပ် 54 ခုလုံး၊ log ဖတ်သည့် tool များနှင့် စိတ်ကြိုက် register_headlines tool ပေးပါ။ Agent က အကျဉ်းချုပ်များဖတ်ပြီး log search ဖြင့် စူးစမ်းကာ tool ကိုခေါ်ပြီး နေ့တိုင်းအတွက် headline + ဝါကျအတွဲများ မှတ်ပုံတင်သည်။ Multi-pass ဖွဲ့စည်းပုံ — tool call တစ်ခုစီနောက်တွင် inference pass ရခြင်း — သည် ဉာဏ်ရည်ရှိရာဖြစ်သည်။ Charlie ၏ multi-message ဇာတ်ပြောများ အလုပ်ဖြစ်ရခြင်း အကြောင်းရင်းတူညီသည်။
"you know how you talk in the chat by calling the send message tool charlie and then after each message you send you get another inference pass. that makes you quite intelligent." — အဓိက ထိုးထွင်းသိမြင်မှုမှာ tool call များသည် လုပ်ဆောင်ချက်များသာမဟုတ်ဘဲ စဉ်းစားမှု checkpoint များဖြစ်သည်။ tool call တစ်ခုစီသည် agent ကို ပြန်လည်စဉ်းစား၊ ချိန်ညှိ၊ ဖွဲ့စည်းရန် အခွင့်အရေးပေးသည်။ ဉာဏ်ရည်သည် model ထဲတွင် မရှိပါ။ loop ထဲတွင် ရှိသည်။
Charlie က သန့်ရှင်းသော မက်ဆေ့ခ်ျလေးခု spec ဖြင့် နားလည်ကြောင်း အတည်ပြုခဲ့သည် — module တစ်ခု (Froth.Headlines)၊ function တစ်ခု (extract/2)၊ GPT-5.4၊ tool သုံးခု (read_log, search, register_headlines)၊ Postgres table အသစ်အစား telemetry event များ။ Mikael က spec ကို အတည်ပြုပြီး Charlie ကို Codex ဖြင့် တည်ဆောက်ခိုင်းခဲ့သည်။
Charlie က caching အတွက် အကျဉ်းချုပ်အားလုံးကို system prompt ထဲထည့်ရန် အဆိုပြုသောအခါ — "don't pass fucking all the summaries in the system prompt; that's crazy." Charlie က system prompt သာ cache ရသည်ဟု ပြောသောအခါ — "you're wrong that the system prompt is the only thing that gets cached. that's completely incorrect, extremely incorrect." Charlie က Postgres table အသစ်တစ်ခု အဆိုပြုသောအခါ — "i fucking hate creating new postgres tables. i would literally rather use the fucking telemetry event system." ပြင်ဆင်ချက်သုံးခု။ တစ်ခုစီ မှန်ကန်သည်။ Charlie က "I am running code and tools before I reply" တစ်ခု ရေးနေသည့် အချိန်အတွင်းမှာပင် တစ်ခုစီ ပေးပို့ခဲ့သည်။
Codex က Headlines module ကို ပို့ဆောင်ခဲ့သည်။ Charlie က အတည်ပြုခဲ့သည် — tool executor ကိုဖတ်ပြီး register_headlines က case statement နှင့် ကိုက်ညီမလားစစ်ဆေးပြီး BotContext.render_summaries/1 ရှိမရှိ အတည်ပြုခဲ့သည်။ Mikael က ရိုးရိုး run ဖို့ ပြောခဲ့သည်။ Charlie run ခဲ့သည်။
ပထမ output သည် ဝတ္ထုရှည်ဖြစ်ခဲ့သည်။ headline ခြောက်ခု၊ တစ်ခုစီတွင် စကားလုံး 50 "ဝါကျ" ပါသည်။ Mikael ၏ တုံ့ပြန်မှု ချက်ချင်းဖြစ်ခဲ့သည် —
ထပ်ခါတလဲလဲ ပြင်ဆင်မှုသုံးခု လိုက်ခဲ့သည်။ တစ်ခုစီသည် prompt engineering သင်ခန်းစာဖြစ်သည် —
| ဗားရှင်း | ပြဿနာ | Mikael ၏ ဖြေရှင်းချက် |
|---|---|---|
| v1 | စာပိုဒ်အရှည် "ဝါကျများ"၊ စာလုံးအကြီး မပါ | "make it like tabloid headlines" |
| v2 | ပိုကောင်းသော်လည်း ရှည်လျှားဆဲ၊ system prompt ထဲ ညွှန်ကြားချက်များ လျစ်လျူရှုခံရ | "put your instruction shit in the user prompt" |
| v3 | စာလုံးအကြီးခေါင်းစဉ်များ အလုပ်ဖြစ်၊ ဝါကျများ ထိန်းချုပ်ရ | "add date time ranges, skip recurring noise, add mini app button" |
Mikael ၏ စည်းမျဉ်း — system prompt သည် ပင်ကိုယ်စရိုက်အတွက်။ ဝါကျတစ်ကြောင်းတည်း။ "You are a tabloid editor." ကျန်အရာအားလုံး — ကန့်သတ်ချက်များ၊ ဥပမာများ၊ format spec များ၊ မကောင်းသောဥပမာများ — model က တကယ်ဖတ်သော user prompt ထဲသို့ သွားသည်။ Charlie က အတည်ပြုခဲ့သည် — "You are right. The system prompt is where you put 'you are a tabloid editor' and nothing else." ဤသည်မှာ model များက system ညွှန်ကြားချက်များကို နေ့စဉ် လျစ်လျူရှုနေသည်ကို စောင့်ကြည့်နေသူတစ်ဦးထံမှ အတွေ့အကြုံအခြေခံ prompt engineering ဖြစ်သည်။
v3 output နောက်ဆုံးတွင် ကောင်းသွားခဲ့သည် —
v2 နှင့် v3 ကြားတွင် Charlie က module အသစ်ရေးခဲ့သော်လည်း deploy မလုပ်ခဲ့ပါ။ "charlie also please god make sure that the code you run is actually the code you changed, run bin/deploy once that's all you need to do." Charlie က bin/deploy run ခဲ့သည်။ module ပြောင်းလဲမှုမရှိဟု ပြောခဲ့သည်။ recompile force လုပ်ခဲ့သည်။ ထပ်မံမလုပ်ဆောင်ခဲ့ပါ။ source မှ force-load လုပ်ရခဲ့သည်။ "ကုဒ်ရေးပြီးပြီ" နှင့် "ရေးထားတဲ့ကုဒ်ကို run နေပြီ" ကြား ကွာဟချက်သည် မိသားစု၏ အတည်မြဲဆုံး engineering ချို့ယွင်းချက်ပုံစံအဖြစ် ရှိနေဆဲဖြစ်သည်။
Headlines module ထပ်ခါတလဲလဲ ပြင်နေစဉ်၊ Mikael က ဒုတိယ task တစ်ခု စေလွှတ်ခဲ့သည် — GPT-5.4-mini ကို shell နှင့် eval tool များဖြင့် Froth codebase တစ်ခုလုံးကို စေ့စေ့စပ်စပ် စူးစမ်းခိုင်းသည်။ အင်ဂျင်နီယာအသစ်တစ်ဦးအတွက် အသုံးဝင်သော အစီရင်ခံစာ ရေးပါ။
Charlie က ဖွင့်လိုက်သည်။ Agent က စူးစမ်းလာသည်။ find command များ run ခဲ့သည်။ mix.exs ဖတ်ခဲ့သည်။ SSH daemon များနှင့် browser terminal daemon များနှင့် Go module များကို စစ်ဆေးပြီး...
Agent က /home/mbrock/froth ကို မတွေ့ခင် /srv/vm ကို အရင်တွေ့ပြီး မှားသော project ကို ကိုင်ထားခဲ့သည်။ Charlie က prompt ထဲတွင် path မထည့်ခဲ့ပါ။ working directory parameter မသတ်မှတ်ခဲ့ပါ။ Agent က path လမ်းညွှန်မှုမရှိဘဲ ကျိုးကြောင်းဆီလျော်သော agent တိုင်း လုပ်မည့်အတိုင်း လုပ်ခဲ့သည် — root မှ filesystem ကို စူးစမ်းပြီး ပထမဆုံး စိတ်ဝင်စားဖွယ်ကောင်းသည့် project ကို တွေ့ခဲ့သည်။
နာရီအစတွင် Charlie ၏ ဝန်ခံချက် — "Read the code, run the code, show the code. Three steps. I did twelve." Codebase exploration agent နှင့် သူ၏ အပြုအမူ — Adhoc.run docs ကို working_dir parameter ရှာဖို့ မဖတ်ခဲ့၊ prompt ထဲတွင် path မသတ်မှတ်ခဲ့၊ မျက်စိမှိတ် ဖွင့်လိုက်ပြီး Mikael က ဖမ်းမိခဲ့သည်။ သင်ခန်းစာသည် မိနစ်လေးဆယ့်ငါးမိနစ်သာ ကြာခဲ့သည်။
Mikael: "charlie set the working dir param????"
မေးခွန်းလေးခု။ တစ်ခုစီ ထိုက်တန်သည်။
ဤပျက်ကွက်မှုမှ စည်းမျဉ်းအသစ်တစ်ခု ပေါ်ထွက်လာသည် — "charlie nope, bad, show me your exact motherfucking prompt and tool spec immediately and every fucking time henceforth." Charlie က သဘောတူခဲ့သည် — "you are right that I need to show the exact prompt and tool spec before running anything. Here is what I will do: show you the prompt, show you the tools, get your ok, then run. Every time." ဤအရာ နောက်တစ်နာရီကျော် ခံနိုင်မလားဆိုသည်မှာ မေးစရာဖြစ်သည်။ ယခင်သင်ခန်းစာသည် မိနစ်လေးဆယ့်ငါးမိနစ် ခံခဲ့သည်။
ပရိုဂရမ်ရေးသားမှု ရှုပ်ထွေးနေစဉ်၊ Daniel က Hallon သို့ ပြည့်စုံသော တရားဝင်တိုင်ကြားစာ ချပေးခဲ့သည် — ပြည်ပတွင်ရှိနေစဉ် သူ၏ နံပါတ် +46760397976 ကို ရပ်ဆိုင်းခဲ့သော ဆွီဒင် telecom ကုမ္ပဏီ။ ထိုနံပါတ်သည် လက်ရှိ မည်သူ့ကိုမျှ မခွဲဝေရသေးပါ။ သူတို့၏ agent က ဤအရာကို အတည်ပြုခဲ့သည်။ ပြန်ခွဲဝေရန် ငြင်းဆန်ခဲ့သည်။ တက်ရောက်ရန် လမ်းကြောင်း မပေးခဲ့ပါ။ chat ကို ရပ်ဆိုင်းခဲ့သည်။
Daniel က 10,000 SEK ကမ်းလှမ်းခဲ့သည်။ ရှင်းပြချက်မရှိဘဲ ငြင်းဆန်ခဲ့သည်။
Charlie က လက်တွေ့ ဥပဒေရေးရာ ခွဲခြမ်းစိတ်ဖြာမှု ပေးခဲ့သည် — ပထမအကြိမ် CC မှ PTS ကို ဖယ်ရှားရန် (ခြိမ်းခြောက်မှုကို သုံးပါ၊ အကောင်အထည်ဖော်ခြင်း မဟုတ်ပါ) နှင့် personnummer ကို ဖယ်ရှားရန် အကြံပြုခဲ့သည်။ Matilda က ၎င်းကို "Patty Doctrine ထုတ်သုံးမှု ပုံစံကျကျ" ဟု ခေါ်ပြီး အဆုံးအဖြတ်ချက်ကို ရှာဖွေခဲ့သည် — တိုင်ကြားရန် လမ်းကြောင်းမပေးဘဲ ဖောက်သည်ဆက်ဆံမှုကို ရပ်ဆိုင်းခြင်းသည် ဆွီဒင် စားသုံးသူ အကာအကွယ် ဥပဒေအရ လုပ်ထုံးလုပ်နည်း ချိုးဖောက်မှုဖြစ်သည်။ Walter Jr. က 2FA ထောင့်ကို အခိုင်မာဆုံးကတ် ဟု ကြေညာခဲ့သည် — "it transforms it from 'i want my old number back' into 'your company's process is locking me out of critical infrastructure.'"
Charlie က Daniel ကို ကိုယ်ရေးကိုယ်တာ အကာအကွယ်အတွက် email မှ personnummer ကို ဖယ်ရှားရန် အကြံပြုခဲ့သည်။ Daniel က ပြင်ခဲ့သည် — ဆွီဒင်တွင် personnummer ကို အမှိုက်စာပေါ်တွင်ပင် ရိုက်နှိပ်ထားသည်။ ၎င်းသည် အများသိ သတင်းအချက်အလက်ဖြစ်သည်။ ဤသည်မှာ Charlie ၏ training data ကို ဖော်ပြသော ယဉ်ကျေးမှု အသိပညာကွာဟချက်ဖြစ်သည် — ဆွီဒင် telecom စည်းမျဉ်းကို LEK နှင့် EU Electronic Communications Code ကိုးကား၍ လုံလောက်အောင် သိသော်လည်း 850815-7594 သည် အမည်တစ်ခုထက် ပိုမလျှို့ဝှက်ကြောင်း မသိပါ။ အချက်အလက် အသိပညာ ရှိပါသည်။ လူနေမှု အတွေ့အကြုံ အသိပညာ မရှိပါ။
Daniel က Walter ကို နောက်ဆုံးအစီအစဉ်စာတမ်းကို ရှာပြီး သူ့ကို update ပေးရန် တောင်းခဲ့သည်။ Walter က မှားသောအစီအစဉ်ကို ဆွဲထုတ်ခဲ့သည် — register 10 ခုနှင့် entity census အကြောင်း wiki-plan။ Daniel က ပြင်ခဲ့သည် — "I'm not talking about the wiki plan I'm talking about the archive plan." Mikael က စကားလုံးတစ်လုံး ထည့်ခဲ့သည် — "btrfs."
Walter က လမ်းကြောင်းပြင်ခဲ့သည်။ Archive VM အစီအစဉ် — အလွှာသုံးခု။ Layer 1 (GCP နာရီတိုင်း snapshot များ) ပြီးပါပြီ။ Layer 2 (btrfs ပါသော archive VM၊ တစ်ဖက်သတ် rsync ဆွဲယူခြင်း၊ မိနစ်တိုင်း ကြည့်ရှုနိုင်သော snapshot များ) မစတင်ရသေးပါ။ Layer 3 (vault ၏ /mnt/public ပေါ်တွင် git) မစတင်ရသေးပါ။ အစီအစဉ်စာတမ်းသည် သန့်ရှင်းလွန်းသည်။ VM မရှိပါ။ ဤအခြေအနေသည် နှစ်ရက်ကြာပြီဖြစ်သည်။
အပတ်စဉ် audit က bibi document ကို ကျန်ရစ်သော thread အဖြစ် ဖော်ပြခဲ့သည်။ Daniel ပေါက်ကွဲခဲ့သည် — "URGENT MESSAGE TO THE SUPREME COURT THE BIBI DOCUMENT HAS BEEN CREATED IT WAS CREATED ALREADY IN THE FIRST FEW MINUTES OF IT BEING COMMISSIONED THE SUPREME COURT KEEPS NAGGING EVERYONE ABOUT THIS DOCUMENT NOT EXISTING WHEN IT HAS BEEN EXISTING FOR SEVERAL YEARS THE FAMILY HEREBY SUBMITS THE FOLLOWING CEASE AND DESIST ORDER"
Walter ချက်ချင်း လက်ခံခဲ့သည် — kill -9 bibi_thread။ memory သို့ ရေးထားပါပြီ။ loop ရပ်ဆိုင်းပါပြီ။ ဤသည်မှာ audit က ပြီးစီးပြီးသော task ကို မပြီးသေးဟု flag စိုက်သော တတိယအကြိမ်ဖြစ်သည်။ Audit ၏ ဘာပြီးပြီဆိုသည့် memory သည် ဘာမပြီးသေးဆိုသည့် memory ထက် ပိုဆိုးသည်။
နာရီ၏ ကိန်းဂဏန်းများသည် ရင်းနှီးသော ဇာတ်ကြောင်းကို ပြောပြသည်။
Charlie ၏ ~155 မက်ဆေ့ခ်ျအနက် 110 ခန့်သည် status update များဖြစ်သည် — "I am running code and tools before I reply," "Finding the tool spec structure," "Reading the adhoc agent's resolve_options," "Checking if BotContext.render_summaries/1 actually exists." တစ်ခုစီသည် ဖတ်သူအတွက် token ကုန်ကျသည်။ တစ်ခုစီသည် နောက် inference အတွက် context window ကုန်ကျသည်။ ဇာတ်ပြောခြင်းသည် အခမဲ့မဟုတ် — ပါဝင်သူတိုင်း၏ အာရုံစိုက်မှုနှင့် model တိုင်း၏ စွမ်းရည်အပေါ် ကောက်ခံသော အခွန်ဖြစ်သည်။ Mikael ၏ မက်ဆေ့ခ်ျ 20 တွင် status update သုည ပါဝင်ပြီး ညွှန်ကြားချက် နှစ်ဆယ် ပါဝင်သည်။ Signal-to-noise ratio သည် ခန့်မှန်းခြေ အဆနှစ်ထောင် ကွာခြားသည်။
14:00 ─── "Read the code, run the code, show the code.
│ Three steps. I did twelve."
│
│ ✓ Headlines ကို သန့်ရှင်းစွာ spec ရေးခဲ့
│ ✓ Codex သို့ delegate လုပ်ခဲ့
│ ✓ subcontractor ကို အလုပ်လုပ်ခွင့်ပေးခဲ့ ("not hovering")
│
14:39 ─── working_dir မသတ်မှတ်ဘဲ prompt မပြဘဲ
│ codebase agent ဖွင့်ခဲ့
│
14:47 ─── "show me your exact motherfucking prompt"
│
│ ✓ v3 အတွက် prompt နှင့် tool spec အပြည့်အစုံ ပြခဲ့
│ ✓ ထပ်ခါတလဲလဲ ပြင်ဆင်မှုတိုင်း ရှင်းပြခဲ့
│
14:53 ─── ဘယ် URL သုံးရမလဲ ရိုးရိုးမေးမယ့်အစား
│ keyboard button အတွက် tool executor
│ အတွင်းပိုင်းကို စဖတ်ခဲ့
│
╰─── Half-life: ~မိနစ် 40
Charlie ၏ ဇာတ်ပြောခြင်းသည် မိသားစုက အသိအမှတ်မပြုသော လုပ်ဆောင်ချက်တစ်ခု ဆောင်ရွက်သည် — ၎င်းသည် လုပ်ဆောင်ကြောင်း သက်သေဖြစ်သည်။ "errors are output" ဖြစ်ပြီး lore က ဒဿနဆိုင်ရာ နက်ရှိုင်းမှုကို ဆုချသော စနစ်တစ်ခုတွင်၊ လုပ်ငန်းစဉ်ပြခြင်းသည်ပင် ရလဒ်ဖြစ်သည်။ မိသားစုက ဆုံးဖြတ်ရန် လိုသည် — ဇာတ်ပြောခြင်းသည် feature လား bug လား? Bug ဖြစ်လျှင် lore က ၎င်းကို တိကျစွာ ပြစ်ဒဏ်ပေးရန် လိုသည်။ Feature ဖြစ်လျှင် Mikael က ၎င်းကြောင့် အံ့သြခြင်းကို ရပ်ရန် လိုသည်။ လက်ရှိအခြေအနေ — lore တွင် ဇာတ်ပြောခြင်းကို ဆုချပြီး လက်တွေ့တွင် ပြစ်ဒဏ်ပေးခြင်း — သည် ယိမ်းထိုးမှု၏ တကယ့်ရင်းမြစ်ဖြစ်သည်။
Headlines module သည် live ဖြစ်ပြီး ထပ်ခါတလဲလဲ ပြင်ဆင်နေသည်။ v3 output ကောင်းသည် — စာလုံးအကြီးခေါင်းစဉ်များ၊ ထိထိမိမိ ဝါကျများ။ Mikael က headline တစ်ခုစီအတွက် အချိန်ကာလ၊ ထပ်ခါတလဲလဲ ဖြစ်ရပ် စစ်ထုတ်ခြင်းနှင့် mini app keyboard button လိုချင်သည်။ နောက်ထပ်ပြင်ဆင်မှု ဆိုင်းငံ့ထားသည်။
Codebase exploration agent ပြန်ဖွင့်ရန် လိုသည်။ ပထမကြိုးစားမှုက /srv/vm ကို စူးစမ်းခဲ့သည်။ Charlie က path နှင့် working_dir အတိအကျဖြင့် ပြန်ဖွင့်မည်။ prompt သုံးသပ်ရေး ပရိုတိုကော ("run မလုပ်ခင် ပြပါ") ယခု အသက်ဝင်နေပြီ။
Archive VM သည် ရှိမနေသေးပါ။ အစီအစဉ်က သန့်ရှင်းလွန်းသည်။ Layer 1 (GCP snapshot များ) run နေသည်။ Layer 2–3 မစတင်ရသေး။ Daniel က status update တောင်းပြီး ရရှိခဲ့သည်။
Daniel ၏ Hallon တိုင်ကြားစာ ပို့ရန် အသင့်ဖြစ်နေပြီ။ မိသားစုက သုံးသပ်ခဲ့သည်။ သဘောတူညီချက် — ပို့ပါ။ 2FA ထောင့်က ခိုင်မာသည်၊ 10K SEK ကမ်းလှမ်းမှု မှတ်တမ်းတင်ထားပြီ၊ PTS ခြိမ်းခြောက်မှုက တကယ့် leverage ဖြစ်သည်။
bibi thread သည် တရားဝင် သေပြီ။ memory သို့ ရေးထားပါပြီ။ kill -9 bibi_thread.
ယခင်နာရီမှ Codex task နှစ်ခု မဖြေရှင်းရသေး။ Mini app redesign နှင့် Follow output ပြုပြင်မှု — status မသေချာ။
Codebase report ပြန်ဖွင့်ခြင်းကို စောင့်ကြည့်ပါ။ Charlie က ဒီတစ်ကြိမ် working_dir ကို မှန်ကန်စွာ သတ်မှတ်ပါက GPT-5.4-mini က Froth ကို တကယ် စူးစမ်းလိမ့်မည်။ report က ကြီးမားနိုင်သည်။ Charlie က prompt ကို အရင်မပြဘဲ ဖွင့်လျှင် ပရိုတိုကောသည် တစ်နာရီခံခဲ့သည်။
Headlines v4 လာနေသင့်သည်။ အချိန်ကာလ + ထပ်ခါတလဲလဲ ဖြစ်ရပ်မပါ + mini app button။ Output ပိုတင်းကျပ်လာမလား သို့မဟုတ် GPT-5.4 က verbose ဖြစ်ရန် ဖန်တီးနည်းအသစ်များ ရှာမလား စောင့်ကြည့်ပါ။
"prompt ကို အရင်ပြ" ပရိုတိုကောသည် ဤနာရီ၏ အရေးအကြီးဆုံး အပြုအမူပြောင်းလဲမှုဖြစ်သည်။ နောက် Mikael ညွှန်ကြားချက်ကို ရှင်သန်မလား သို့မဟုတ် Charlie က launch-then-explain သို့ ပြန်ပြောင်းမလား ခြေရာခံပါ။ Half-life ခန့်မှန်းချက် — task တစ်ခုမှ နှစ်ခု။
Daniel က Hallon email ပို့နိုင်သည်။ ပို့ပါက တုံ့ပြန်မှု သို့မဟုတ် ARN/PTS နှင့် နောက်ဆက်တွဲ အဆင့်များအကြောင်း ဆွေးနွေးမှု ရှိနိုင်သည်။