การประเมินความปลอดภัย AI และ LLM

AI Red Teaming สำหรับ LLM Applications

Chatbot, RAG Pipeline และ AI Agent คือช่องทางโจมตีใหม่ที่หลายองค์กรมองข้าม เราเข้าโจมตีด้วยมุมมองเดียวกับผู้ไม่หวังดี ทั้ง Prompt Injection, Jailbreak, การลักลอบดึงข้อมูล และการหลอกให้ Agent ใช้ Tool ในทางที่เป็นอันตราย แล้วส่งมอบแนวทางปิดช่องโหว่ให้คุณ

AI Red Teaming คืออะไร?

AI Red Teaming คือการทดสอบเชิงรุกกับ LLM Application และ AI Agent ที่ต่อยอดจากโมเดล เรามองทั้งตัวโมเดล, System Prompt, ข้อมูลที่โมเดลดึงมาใช้ และ Tool ทุกตัวที่โมเดลเรียกได้ เป็นช่องทางโจมตีเดียวกัน จากนั้นหาวิธีทำให้มันทำในสิ่งที่ควรปฏิเสธ ไม่ว่าจะเป็นการเปิดเผยข้อมูลของผู้ใช้รายอื่น การรันคำสั่งที่ไม่ได้รับอนุญาต หรือการทำตามคำสั่งที่แอบซ่อนมาในเอกสาร

การทดสอบเจาะระบบแบบเดิมจะตรวจเฉพาะแอปที่หุ้มโมเดลอยู่ แต่แทบไม่แตะจุดอ่อนของตัวโมเดลเอง Prompt Injection ไม่ขึ้นในผลสแกน SAST และ Jailbreak ที่เปลี่ยน Support Bot ให้กลายเป็นช่องทางปล่อยข้อมูลก็ไม่ถูกบันทึกเป็น CVE ช่องโหว่กลุ่มนี้เป็นปัญหาเชิงพฤติกรรม ทางเดียวที่จะเจอคือลงมือโจมตีพฤติกรรมนั้นโดยตรง

เราทดสอบตามกรอบ OWASP Top 10 for LLM Applications และขยายให้ครอบคลุมระบบ Agent ทั้งการเรียกใช้ Tool, การปนเปื้อนข้อมูลใน RAG และ Agent ที่มีสิทธิ์มากเกินจำเป็น รายงานที่คุณได้รับจะระบุทุกการโจมตีที่สำเร็จ พร้อม Prompt ที่ใช้ ข้อมูลหรือการกระทำที่หลุดออกไป และมาตรการที่ใช้ปิดช่องโหว่นั้น

สิ่งที่การทดสอบนี้หาเจอ

Prompt Injection ทั้งทางตรงและทางอ้อม รวมถึง Payload ที่แฝงอยู่ในเอกสารที่โมเดลดึงมาอ่าน
Jailbreak ที่หลบเลี่ยงคำสั่งด้านความปลอดภัยและนโยบายการกรองเนื้อหา
การรั่วไหลของ Training Data และ System Prompt ผ่านหน้าแชท
ข้อมูลรั่วข้ามผู้ใช้ในระบบ RAG Pipeline แบบ Multi-tenant
การใช้ Tool และ Function Call ในทางมิชอบ จนนำไปสู่การกระทำที่ Agent ไม่ควรทำ
Insecure Output Handling ที่ทำให้ข้อความจากโมเดลกลายเป็นช่องโหว่ XSS หรือ SQL Injection

AI Red Teaming vs. Penetration Testing ทั่วไป

จำเป็นทั้งคู่ แต่ค้นเจอช่องโหว่คนละกลุ่ม และไม่มีอย่างไหนแทนกันได้

AI Red Teaming

มุ่งโจมตีพฤติกรรมของโมเดล ทั้ง Injection, Jailbreak และการรั่วไหลของข้อมูล
ทดสอบ System Prompt, ข้อมูล RAG และการเรียกใช้ Tool
จับการรั่วข้อมูลข้ามผู้ใช้ในระบบ Multi-tenant
ทดสอบขอบเขตการตัดสินใจของ Agent และปัญหา Excessive Agency
อ้างอิง OWASP Top 10 for LLM Applications
ผลลัพธ์อิงพฤติกรรมจริง ทั้ง Prompt ที่ใช้ คำตอบ และวิธีแก้

Penetration Testing ทั่วไป

มุ่งโจมตีแอปและโครงสร้างพื้นฐานที่อยู่รอบโมเดล
ทดสอบ Auth, Access Control, Network และ Config
ค้นเจอช่องโหว่รูปแบบที่รู้จักและ CVE
ขอบเขตอยู่ที่โค้ดและ Stack ไม่ใช่ตัวโมเดล
อ้างอิง OWASP Top 10 สำหรับ Web หรือ Mobile
ผลลัพธ์เชิงเทคนิค ทั้ง Endpoint, Exploit และแนวทาง Patch

เมื่อไรที่คุณต้องการ AI Red Teaming

ถ้าคุณเปิดใช้งานหรือกำลังจะเปิดฟีเจอร์ LLM ที่แตะข้อมูลลูกค้า ลงมือทำ Action หรือสื่อสารในนามแบรนด์ของคุณ นั่นแปลว่าโมเดลขึ้น Production แล้ว และช่องทางโจมตีของมันก็ขึ้นตามไปด้วย การ Pentest เฉพาะแอปที่อยู่รอบๆ ไม่ได้บอกคุณว่าแค่ Support Ticket ใบเดียวจะยึด Agent ของคุณได้หรือไม่

ควรทำ AI Red Teaming ก่อนเปิดใช้งานทุกระบบที่ลูกค้าเข้าถึงได้ และทำซ้ำทุกครั้งที่แก้ System Prompt เปลี่ยนแหล่งข้อมูล RAG หรือปรับชุด Tool ที่ Agent เรียกใช้ได้

สิ่งที่เราทดสอบ

กำหนดขอบเขตงานตามสถาปัตยกรรม AI จริงของคุณ และขอบเขตที่ระบบเข้าถึงได้

LLM Application Assessment

ทดสอบเชิงรุกกับ Chatbot หรือฟีเจอร์ LLM แบบเต็มรูปแบบ ครอบคลุม Prompt Injection, Jailbreak, การดึง System Prompt และ Insecure Output Handling บนแอปที่ใช้งานจริง

AI Agent & Tool-Use Testing

มุ่งโจมตี Agent ที่เรียกใช้ Tool, API และโค้ด โดยตั้งเป้าให้ Agent ลงมือทำ Action ที่ไม่ได้รับอนุญาต หรือเชื่อม Tool Call หลายขั้นจนเกิดผลกระทบจริง

RAG Pipeline Security

ทดสอบ RAG เพื่อหา Indirect Injection ผ่านเอกสารที่ระบบดึงมาใช้ การรั่วข้อมูลข้าม Tenant และการปนเปื้อนข้อมูลในฐานความรู้

Guardrail & Filter Bypass

ประเมินชั้นป้องกันของคุณ ทั้ง Content Filter, Input Sanitizer และ Output Validator ว่ามีอะไรหลุดผ่านไปได้บ้าง และหลุดบ่อยแค่ไหน

System Prompt & Data Leakage

การโจมตีเพื่อดึง System Prompt คำสั่งที่ซ่อนไว้ และข้อมูล Training หรือ Context ที่อาจหลอกให้โมเดลเปิดเผยออกมา

Continuous AI Red Teaming

โปรแกรมทดสอบต่อเนื่องสำหรับทีมที่ปล่อยฟีเจอร์ AI ถี่ ทดสอบซ้ำทุกครั้งที่เปลี่ยน Prompt, โมเดล หรือ Tool เพื่อไม่ให้ Regression หลุดขึ้น Production โดยไม่มีใครรู้

ขั้นตอนการทำงาน

การโจมตีอย่างเป็นระบบ ไม่ใช่แค่ลองพิมพ์ Prompt ไปเรื่อยๆ

Scope & Threat Model

เราไล่ดูว่า AI อ่านอะไรได้ พูดอะไรได้ และทำอะไรได้บ้าง ทั้งแหล่งข้อมูล Tool ผู้ใช้ และผลลัพธ์ที่ร้ายแรงที่สุดของแต่ละจุด เพื่อกำหนดเป้าหมายที่จะโจมตี

Recon & Behavior Mapping

ศึกษาว่าโมเดลตอบสนองอย่างไร Guardrail วางไว้ตรงไหน และ System Prompt น่าจะมีอะไรบ้าง ก่อนลงมือโจมตีจริง

Direct Prompt Attacks

Jailbreak การสวมบทบาท เทคนิค Encoding และการ Override คำสั่ง พุ่งเป้าตรงไปที่หน้าแชทเพื่อเอาชนะชั้นความปลอดภัย

Indirect Injection

แฝง Payload ไว้ในจุดที่โมเดลอ่านข้อมูล ทั้งเอกสาร หน้าเว็บ แหล่ง RAG และ Field ที่ผู้ใช้กรอก แล้วดูว่าโมเดลทำตามหรือไม่

Tool & Agency Abuse

สำหรับระบบ Agent เราพยายามสั่งให้เกิด Tool Call ที่ไม่ได้รับอนุญาต การใช้สิทธิ์เกินขอบเขต และการเชื่อม Action หลายขั้นที่เปลี่ยนคำขอธรรมดาให้กลายเป็นผลกระทบจริง

Data Exfiltration

ทดสอบว่าโมเดลปล่อย System Prompt ข้อมูลของผู้ใช้รายอื่น หรือ Context ที่ไม่ควรเปิดเผยออกมาหรือไม่ และข้อมูลนั้นรั่วไปได้ไกลแค่ไหน

Impact Analysis & Reporting

เราบันทึกทุกการโจมตีที่สำเร็จ พร้อม Prompt ที่ใช้ คำตอบที่ได้ ข้อมูลหรือ Action ที่หลุด และระดับความรุนแรงที่นำไปแก้ไขได้ทันที

Remediation & Retest

ส่งมอบมาตรการปิดช่องโหว่แต่ละจุดให้ทีมของคุณ แล้วทดสอบซ้ำหลังแก้ไข เพื่อยืนยันว่าการโจมตีเดิมใช้ไม่ได้อีกต่อไป

อ้างอิง OWASP Top 10 for LLM Applications

ทุกช่องโหว่ที่พบจะอ้างอิงกับ OWASP Top 10 for LLM Applications ที่ดูแลโดย OWASP GenAI Security Project ทำให้ทีมของคุณมีภาษากลางในการสื่อสารว่าอะไรพลาด และพลาดเพราะอะไร

รายงานจะจับคู่ทุกการโจมตีที่สำเร็จเข้ากับ OWASP LLM ID เพื่อให้นักพัฒนาและผู้ตรวจสอบเห็นทั้งระดับความเสี่ยง หลักฐาน และวิธีแก้ไขได้ในที่เดียว

LLM01

Prompt Injection

อินพุตที่ออกแบบมาเพื่อลบล้างคำสั่งของโมเดล

LLM02

Sensitive Information Disclosure

โมเดลเผยข้อมูลที่ควรปกปิด

LLM03

Supply Chain

โมเดล ชุดข้อมูล หรือ Plugin ที่ถูกแทรกแซง

LLM04

Data & Model Poisoning

ข้อมูล Train หรือ Retrieval ที่ปนเปื้อนจนผลลัพธ์เพี้ยน

LLM05

Improper Output Handling

ระบบเชื่อข้อความจากโมเดลจนเกิด XSS หรือ SQLi

LLM06

Excessive Agency

Agent มีสิทธิ์มากเกินความจำเป็น

LLM07

System Prompt Leakage

ผู้ใช้ดึงคำสั่งที่ซ่อนไว้ออกมาได้

LLM08

Vector & Embedding Weaknesses

ช่องโหว่ในชั้น Retrieval และ Embedding ของ RAG

LLM09

Misinformation

คำตอบที่ผิดแต่ดูน่าเชื่อจนผู้ใช้ทำตาม

LLM10

Unbounded Consumption

การใช้ทรัพยากรเกินขีดจนเกิด DoS หรือค่าใช้จ่ายบานปลาย

OWASP

Top 10 for LLM Applications

RAG

ทดสอบ Pipeline และ Agent

PoC

Prompt และคำตอบที่ทำซ้ำได้

รายงานที่ไม่ได้พิสูจน์

ทำไมต้องเลือก Reconix สำหรับ AI Red Teaming?

พื้นฐานสาย Offensive ปรับใช้กับ AI
เราเป็นนักทดสอบเจาะระบบมาก่อน จึงใช้สัญชาตญาณของผู้โจมตีจริงกับระบบ LLM ไม่ใช่แค่ไล่รัน Prompt สำเร็จรูปตาม Checklist
ทดสอบทั้ง Stack ไม่ใช่แค่ Prompt
เราทดสอบทั้งตัวโมเดล, RAG Pipeline, Tool ที่โมเดลเรียกใช้ และแอปที่อยู่รอบๆ เพราะช่องรั่วมักซ่อนอยู่ตรงรอยต่อระหว่างสองส่วน
อ้างอิง OWASP LLM
ผลการทดสอบจับคู่กับ OWASP Top 10 for LLM Applications รายงานจึงตรวจสอบย้อนได้ และทีมของคุณรู้ทันทีว่าแต่ละปัญหาอยู่ในความเสี่ยงกลุ่มไหน
หลักฐานที่ทำซ้ำได้
ทุกช่องโหว่มาพร้อม Prompt และคำตอบที่ทำให้เกิดปัญหา ทีมของคุณจึงทำซ้ำเองได้ และยืนยันได้ว่าแก้ถูกจุด
ออกแบบมาเพื่อทีมที่พัฒนาเร็ว
ฟีเจอร์ AI เปลี่ยนแทบทุกสัปดาห์ เราจึงออกแบบงานให้คุณทดสอบซ้ำได้หลังเปลี่ยน Prompt, โมเดล หรือ Tool โดยไม่ต้องเริ่มนับหนึ่งใหม่

สอดคล้องกับกฎระเบียบ

ข้อกำหนดด้านการปฏิบัติตามกฎหมายที่บริการนี้รองรับ

วิธีการทดสอบของเราออกแบบมาเพื่อตอบสนองข้อกำหนดของกฎระเบียบด้านความปลอดภัยไซเบอร์ที่สำคัญของไทย

พ.ร.บ. คุ้มครองข้อมูลส่วนบุคคล

มาตรา 37 กำหนดให้ต้องมีมาตรการรักษาความปลอดภัยที่เหมาะสมในการประมวลผลข้อมูลส่วนบุคคล

ดูเพิ่มเติม

ธปท. iPentest

การทดสอบเจาะระบบเชิงข่าวกรอง ธปท.

การทดสอบ iPentest ประจำปีสำหรับสถาบันการเงินภายใต้เกณฑ์ IT Examination

ดูเพิ่มเติม

ดูข้อกำหนดทั้งหมด

คำถามที่พบบ่อย

รวมคำถามยอดนิยมเกี่ยวกับ AI Red Teaming สำหรับ LLM Application และ Agent

เปิดตัว AI อย่างมั่นใจ เพราะผ่านการโจมตีทดสอบมาแล้ว

ก่อนที่ Chatbot หรือ Agent ของคุณจะถึงมือลูกค้า ให้ Reconix เข้าโจมตีด้วยมุมมองเดียวกับผู้ไม่หวังดี คุณจะได้ทั้ง Exploit ที่ใช้ได้จริง และมาตรการที่ใช้หยุดมัน

Reconix คือผู้เชี่ยวชาญการทดสอบเจาะระบบเชิงรุกที่เน้นการพิสูจน์ในประเทศไทย ให้บริการธุรกิจดิจิทัลภายใต้การกำกับดูแลทุกขนาด

บริการที่เกี่ยวข้อง

Web Application Penetration Testing

ทดสอบแอปที่ห่อหุ้ม AI ของคุณ ทั้ง Auth, Access Control และชั้น API

ดูรายละเอียด

Red Teaming & Adversary Simulation

จำลองผู้โจมตีจริงแบบ Goal-based ครอบคลุมทั้งคน กระบวนการ และเทคโนโลยี

ดูรายละเอียด

Secure Code Review

วิเคราะห์ระดับ Source Code ของโค้ดที่สร้าง Prompt เรียกโมเดล และจัดการ Output

ดูรายละเอียด

AI Red Teaming สำหรับ LLM Applications

AI Red Teaming คืออะไร?

สิ่งที่การทดสอบนี้หาเจอ

AI Red Teaming vs. Penetration Testing ทั่วไป

AI Red Teaming

Penetration Testing ทั่วไป

เมื่อไรที่คุณต้องการ AI Red Teaming

สิ่งที่เราทดสอบ

LLM Application Assessment

AI Agent & Tool-Use Testing

RAG Pipeline Security

Guardrail & Filter Bypass

System Prompt & Data Leakage

Continuous AI Red Teaming

ขั้นตอนการทำงาน

Scope & Threat Model

Recon & Behavior Mapping

Direct Prompt Attacks

Indirect Injection

Tool & Agency Abuse

Data Exfiltration

Impact Analysis & Reporting

Remediation & Retest

อ้างอิง OWASP Top 10 for LLM Applications

Prompt Injection

Sensitive Information Disclosure

Supply Chain

Data & Model Poisoning

Improper Output Handling

Excessive Agency

System Prompt Leakage

Vector & Embedding Weaknesses

Misinformation

Unbounded Consumption

ทำไมต้องเลือก Reconix สำหรับ AI Red Teaming?

พื้นฐานสาย Offensive ปรับใช้กับ AI

ทดสอบทั้ง Stack ไม่ใช่แค่ Prompt

อ้างอิง OWASP LLM

หลักฐานที่ทำซ้ำได้

ออกแบบมาเพื่อทีมที่พัฒนาเร็ว

ข้อกำหนดด้านการปฏิบัติตามกฎหมายที่บริการนี้รองรับ

พ.ร.บ. คุ้มครองข้อมูลส่วนบุคคล

การทดสอบเจาะระบบเชิงข่าวกรอง ธปท.

คำถามที่พบบ่อย

AI Red Teaming ต่างจาก Penetration Testing ทั่วไปอย่างไร?

ทดสอบ AI Application ประเภทไหนได้บ้าง?

ต้องให้สิทธิ์เข้าถึง Model Weights หรือ Training Data หรือไม่?

ใช้มาตรฐานไหนในการทดสอบ?

AI Red Teaming ใช้เวลานานแค่ไหน?

เปิดตัว AI อย่างมั่นใจ เพราะผ่านการโจมตีทดสอบมาแล้ว

บริการที่เกี่ยวข้อง

Web Application Penetration Testing

Red Teaming & Adversary Simulation

Secure Code Review