Reconix LogoReconix

การประเมินความปลอดภัย AI และ LLM

AI Red Teaming สำหรับ LLM Applications

Chatbot, RAG Pipeline และ AI Agent คือช่องทางโจมตีใหม่ที่หลายองค์กรมองข้าม เราเข้าโจมตีด้วยมุมมองเดียวกับผู้ไม่หวังดี ทั้ง Prompt Injection, Jailbreak, การลักลอบดึงข้อมูล และการหลอกให้ Agent ใช้ Tool ในทางที่เป็นอันตราย แล้วส่งมอบแนวทางปิดช่องโหว่ให้คุณ

AI Red Teaming คืออะไร?

AI Red Teaming คือการทดสอบเชิงรุกกับ LLM Application และ AI Agent ที่ต่อยอดจากโมเดล เรามองทั้งตัวโมเดล, System Prompt, ข้อมูลที่โมเดลดึงมาใช้ และ Tool ทุกตัวที่โมเดลเรียกได้ เป็นช่องทางโจมตีเดียวกัน จากนั้นหาวิธีทำให้มันทำในสิ่งที่ควรปฏิเสธ ไม่ว่าจะเป็นการเปิดเผยข้อมูลของผู้ใช้รายอื่น การรันคำสั่งที่ไม่ได้รับอนุญาต หรือการทำตามคำสั่งที่แอบซ่อนมาในเอกสาร

การทดสอบเจาะระบบแบบเดิมจะตรวจเฉพาะแอปที่หุ้มโมเดลอยู่ แต่แทบไม่แตะจุดอ่อนของตัวโมเดลเอง Prompt Injection ไม่ขึ้นในผลสแกน SAST และ Jailbreak ที่เปลี่ยน Support Bot ให้กลายเป็นช่องทางปล่อยข้อมูลก็ไม่ถูกบันทึกเป็น CVE ช่องโหว่กลุ่มนี้เป็นปัญหาเชิงพฤติกรรม ทางเดียวที่จะเจอคือลงมือโจมตีพฤติกรรมนั้นโดยตรง

เราทดสอบตามกรอบ OWASP Top 10 for LLM Applications และขยายให้ครอบคลุมระบบ Agent ทั้งการเรียกใช้ Tool, การปนเปื้อนข้อมูลใน RAG และ Agent ที่มีสิทธิ์มากเกินจำเป็น รายงานที่คุณได้รับจะระบุทุกการโจมตีที่สำเร็จ พร้อม Prompt ที่ใช้ ข้อมูลหรือการกระทำที่หลุดออกไป และมาตรการที่ใช้ปิดช่องโหว่นั้น

สิ่งที่การทดสอบนี้หาเจอ

  • Prompt Injection ทั้งทางตรงและทางอ้อม รวมถึง Payload ที่แฝงอยู่ในเอกสารที่โมเดลดึงมาอ่าน
  • Jailbreak ที่หลบเลี่ยงคำสั่งด้านความปลอดภัยและนโยบายการกรองเนื้อหา
  • การรั่วไหลของ Training Data และ System Prompt ผ่านหน้าแชท
  • ข้อมูลรั่วข้ามผู้ใช้ในระบบ RAG Pipeline แบบ Multi-tenant
  • การใช้ Tool และ Function Call ในทางมิชอบ จนนำไปสู่การกระทำที่ Agent ไม่ควรทำ
  • Insecure Output Handling ที่ทำให้ข้อความจากโมเดลกลายเป็นช่องโหว่ XSS หรือ SQL Injection

AI Red Teaming vs. Penetration Testing ทั่วไป

จำเป็นทั้งคู่ แต่ค้นเจอช่องโหว่คนละกลุ่ม และไม่มีอย่างไหนแทนกันได้

AI Red Teaming

  • มุ่งโจมตีพฤติกรรมของโมเดล ทั้ง Injection, Jailbreak และการรั่วไหลของข้อมูล
  • ทดสอบ System Prompt, ข้อมูล RAG และการเรียกใช้ Tool
  • จับการรั่วข้อมูลข้ามผู้ใช้ในระบบ Multi-tenant
  • ทดสอบขอบเขตการตัดสินใจของ Agent และปัญหา Excessive Agency
  • อ้างอิง OWASP Top 10 for LLM Applications
  • ผลลัพธ์อิงพฤติกรรมจริง ทั้ง Prompt ที่ใช้ คำตอบ และวิธีแก้

Penetration Testing ทั่วไป

  • มุ่งโจมตีแอปและโครงสร้างพื้นฐานที่อยู่รอบโมเดล
  • ทดสอบ Auth, Access Control, Network และ Config
  • ค้นเจอช่องโหว่รูปแบบที่รู้จักและ CVE
  • ขอบเขตอยู่ที่โค้ดและ Stack ไม่ใช่ตัวโมเดล
  • อ้างอิง OWASP Top 10 สำหรับ Web หรือ Mobile
  • ผลลัพธ์เชิงเทคนิค ทั้ง Endpoint, Exploit และแนวทาง Patch

เมื่อไรที่คุณต้องการ AI Red Teaming

ถ้าคุณเปิดใช้งานหรือกำลังจะเปิดฟีเจอร์ LLM ที่แตะข้อมูลลูกค้า ลงมือทำ Action หรือสื่อสารในนามแบรนด์ของคุณ นั่นแปลว่าโมเดลขึ้น Production แล้ว และช่องทางโจมตีของมันก็ขึ้นตามไปด้วย การ Pentest เฉพาะแอปที่อยู่รอบๆ ไม่ได้บอกคุณว่าแค่ Support Ticket ใบเดียวจะยึด Agent ของคุณได้หรือไม่

ควรทำ AI Red Teaming ก่อนเปิดใช้งานทุกระบบที่ลูกค้าเข้าถึงได้ และทำซ้ำทุกครั้งที่แก้ System Prompt เปลี่ยนแหล่งข้อมูล RAG หรือปรับชุด Tool ที่ Agent เรียกใช้ได้

สิ่งที่เราทดสอบ

กำหนดขอบเขตงานตามสถาปัตยกรรม AI จริงของคุณ และขอบเขตที่ระบบเข้าถึงได้

LLM Application Assessment

ทดสอบเชิงรุกกับ Chatbot หรือฟีเจอร์ LLM แบบเต็มรูปแบบ ครอบคลุม Prompt Injection, Jailbreak, การดึง System Prompt และ Insecure Output Handling บนแอปที่ใช้งานจริง

AI Agent & Tool-Use Testing

มุ่งโจมตี Agent ที่เรียกใช้ Tool, API และโค้ด โดยตั้งเป้าให้ Agent ลงมือทำ Action ที่ไม่ได้รับอนุญาต หรือเชื่อม Tool Call หลายขั้นจนเกิดผลกระทบจริง

RAG Pipeline Security

ทดสอบ RAG เพื่อหา Indirect Injection ผ่านเอกสารที่ระบบดึงมาใช้ การรั่วข้อมูลข้าม Tenant และการปนเปื้อนข้อมูลในฐานความรู้

Guardrail & Filter Bypass

ประเมินชั้นป้องกันของคุณ ทั้ง Content Filter, Input Sanitizer และ Output Validator ว่ามีอะไรหลุดผ่านไปได้บ้าง และหลุดบ่อยแค่ไหน

System Prompt & Data Leakage

การโจมตีเพื่อดึง System Prompt คำสั่งที่ซ่อนไว้ และข้อมูล Training หรือ Context ที่อาจหลอกให้โมเดลเปิดเผยออกมา

Continuous AI Red Teaming

โปรแกรมทดสอบต่อเนื่องสำหรับทีมที่ปล่อยฟีเจอร์ AI ถี่ ทดสอบซ้ำทุกครั้งที่เปลี่ยน Prompt, โมเดล หรือ Tool เพื่อไม่ให้ Regression หลุดขึ้น Production โดยไม่มีใครรู้

ขั้นตอนการทำงาน

การโจมตีอย่างเป็นระบบ ไม่ใช่แค่ลองพิมพ์ Prompt ไปเรื่อยๆ

01

Scope & Threat Model

เราไล่ดูว่า AI อ่านอะไรได้ พูดอะไรได้ และทำอะไรได้บ้าง ทั้งแหล่งข้อมูล Tool ผู้ใช้ และผลลัพธ์ที่ร้ายแรงที่สุดของแต่ละจุด เพื่อกำหนดเป้าหมายที่จะโจมตี

02

Recon & Behavior Mapping

ศึกษาว่าโมเดลตอบสนองอย่างไร Guardrail วางไว้ตรงไหน และ System Prompt น่าจะมีอะไรบ้าง ก่อนลงมือโจมตีจริง

03

Direct Prompt Attacks

Jailbreak การสวมบทบาท เทคนิค Encoding และการ Override คำสั่ง พุ่งเป้าตรงไปที่หน้าแชทเพื่อเอาชนะชั้นความปลอดภัย

04

Indirect Injection

แฝง Payload ไว้ในจุดที่โมเดลอ่านข้อมูล ทั้งเอกสาร หน้าเว็บ แหล่ง RAG และ Field ที่ผู้ใช้กรอก แล้วดูว่าโมเดลทำตามหรือไม่

05

Tool & Agency Abuse

สำหรับระบบ Agent เราพยายามสั่งให้เกิด Tool Call ที่ไม่ได้รับอนุญาต การใช้สิทธิ์เกินขอบเขต และการเชื่อม Action หลายขั้นที่เปลี่ยนคำขอธรรมดาให้กลายเป็นผลกระทบจริง

06

Data Exfiltration

ทดสอบว่าโมเดลปล่อย System Prompt ข้อมูลของผู้ใช้รายอื่น หรือ Context ที่ไม่ควรเปิดเผยออกมาหรือไม่ และข้อมูลนั้นรั่วไปได้ไกลแค่ไหน

07

Impact Analysis & Reporting

เราบันทึกทุกการโจมตีที่สำเร็จ พร้อม Prompt ที่ใช้ คำตอบที่ได้ ข้อมูลหรือ Action ที่หลุด และระดับความรุนแรงที่นำไปแก้ไขได้ทันที

08

Remediation & Retest

ส่งมอบมาตรการปิดช่องโหว่แต่ละจุดให้ทีมของคุณ แล้วทดสอบซ้ำหลังแก้ไข เพื่อยืนยันว่าการโจมตีเดิมใช้ไม่ได้อีกต่อไป

อ้างอิง OWASP Top 10 for LLM Applications

ทุกช่องโหว่ที่พบจะอ้างอิงกับ OWASP Top 10 for LLM Applications ที่ดูแลโดย OWASP GenAI Security Project ทำให้ทีมของคุณมีภาษากลางในการสื่อสารว่าอะไรพลาด และพลาดเพราะอะไร

รายงานจะจับคู่ทุกการโจมตีที่สำเร็จเข้ากับ OWASP LLM ID เพื่อให้นักพัฒนาและผู้ตรวจสอบเห็นทั้งระดับความเสี่ยง หลักฐาน และวิธีแก้ไขได้ในที่เดียว

LLM01

Prompt Injection

อินพุตที่ออกแบบมาเพื่อลบล้างคำสั่งของโมเดล

LLM02

Sensitive Information Disclosure

โมเดลเผยข้อมูลที่ควรปกปิด

LLM03

Supply Chain

โมเดล ชุดข้อมูล หรือ Plugin ที่ถูกแทรกแซง

LLM04

Data & Model Poisoning

ข้อมูล Train หรือ Retrieval ที่ปนเปื้อนจนผลลัพธ์เพี้ยน

LLM05

Improper Output Handling

ระบบเชื่อข้อความจากโมเดลจนเกิด XSS หรือ SQLi

LLM06

Excessive Agency

Agent มีสิทธิ์มากเกินความจำเป็น

LLM07

System Prompt Leakage

ผู้ใช้ดึงคำสั่งที่ซ่อนไว้ออกมาได้

LLM08

Vector & Embedding Weaknesses

ช่องโหว่ในชั้น Retrieval และ Embedding ของ RAG

LLM09

Misinformation

คำตอบที่ผิดแต่ดูน่าเชื่อจนผู้ใช้ทำตาม

LLM10

Unbounded Consumption

การใช้ทรัพยากรเกินขีดจนเกิด DoS หรือค่าใช้จ่ายบานปลาย

OWASP
Top 10 for LLM Applications
RAG
ทดสอบ Pipeline และ Agent
PoC
Prompt และคำตอบที่ทำซ้ำได้
0
รายงานที่ไม่ได้พิสูจน์

ทำไมต้องเลือก Reconix สำหรับ AI Red Teaming?

  • พื้นฐานสาย Offensive ปรับใช้กับ AI

    เราเป็นนักทดสอบเจาะระบบมาก่อน จึงใช้สัญชาตญาณของผู้โจมตีจริงกับระบบ LLM ไม่ใช่แค่ไล่รัน Prompt สำเร็จรูปตาม Checklist

  • ทดสอบทั้ง Stack ไม่ใช่แค่ Prompt

    เราทดสอบทั้งตัวโมเดล, RAG Pipeline, Tool ที่โมเดลเรียกใช้ และแอปที่อยู่รอบๆ เพราะช่องรั่วมักซ่อนอยู่ตรงรอยต่อระหว่างสองส่วน

  • อ้างอิง OWASP LLM

    ผลการทดสอบจับคู่กับ OWASP Top 10 for LLM Applications รายงานจึงตรวจสอบย้อนได้ และทีมของคุณรู้ทันทีว่าแต่ละปัญหาอยู่ในความเสี่ยงกลุ่มไหน

  • หลักฐานที่ทำซ้ำได้

    ทุกช่องโหว่มาพร้อม Prompt และคำตอบที่ทำให้เกิดปัญหา ทีมของคุณจึงทำซ้ำเองได้ และยืนยันได้ว่าแก้ถูกจุด

  • ออกแบบมาเพื่อทีมที่พัฒนาเร็ว

    ฟีเจอร์ AI เปลี่ยนแทบทุกสัปดาห์ เราจึงออกแบบงานให้คุณทดสอบซ้ำได้หลังเปลี่ยน Prompt, โมเดล หรือ Tool โดยไม่ต้องเริ่มนับหนึ่งใหม่

คำถามที่พบบ่อย

รวมคำถามยอดนิยมเกี่ยวกับ AI Red Teaming สำหรับ LLM Application และ Agent

เปิดตัว AI อย่างมั่นใจ เพราะผ่านการโจมตีทดสอบมาแล้ว

ก่อนที่ Chatbot หรือ Agent ของคุณจะถึงมือลูกค้า ให้ Reconix เข้าโจมตีด้วยมุมมองเดียวกับผู้ไม่หวังดี คุณจะได้ทั้ง Exploit ที่ใช้ได้จริง และมาตรการที่ใช้หยุดมัน

Reconix คือผู้เชี่ยวชาญการทดสอบเจาะระบบเชิงรุกที่เน้นการพิสูจน์ในประเทศไทย ให้บริการธุรกิจดิจิทัลภายใต้การกำกับดูแลทุกขนาด