Public Test Phaseteam4-phase
PAIC 2026 - PTNK AI Challenge 2026
Kì thi AI do cộng đồng The Noders PTNK tổ chức cho đối tượng học sinh cấp 3.
Teams: 1-3 members
Metric: MAE (Mean Absolute Error) ↓
54 participants
Public test ends in
--Days
:--Hours
:--Minutes
:--Seconds
Competition Timeline
Registration Period
Jan 4, 2026→Jan 4, 2026
Duration: 1 days
Public Test Phase
Jan 4, 2026→Jan 17, 2026
Duration: 13 days
Private Test Phase
Jan 17, 2026→Jan 18, 2026
Duration: 1 days
Problem Statement
Problem Statement
1. Tổng quan bài toán
Mục tiêu của dự án là xây dựng một hệ thống chấm điểm tự động (Automated Essay Scoring - AES) cho các bài luận IELTS, sử dụng các kỹ thuật Xử lý Ngôn ngữ Tự nhiên (NLP) và Deep Learning tiên tiến. Hệ thống này nhằm hỗ trợ người học đánh giá năng lực viết của mình một cách nhanh chóng và khách quan.
2. Dữ liệu huấn luyện (Training Data)
Tập dữ liệu bao gồm các bài thi viết IELTS thực tế, với cấu trúc chính như sau:
- Prompt (Đề bài): Chủ đề hoặc câu hỏi mà thí sinh cần giải quyết.
- Image Description (Mô tả hình ảnh): Mô tả chi tiết về biểu đồ hoặc hình ảnh trong đề bài Writing Task 1 (hiện tại chưa được sử dụng trong mô hình nhưng có sẵn trong dữ liệu).
- Essay (Bài làm): Nội dung văn bản bài luận do thí sinh viết.
- Overall Score (Nhãn): Điểm số tổng kết (Band Score) do giám khảo con người chấm, nằm trong thang điểm từ 1.0 đến 9.0.
- Điểm thành phần cho từng mục Tash Response, Lexical Resource, Coherence and Cohesion và Grammar Range and Accuracy.
3. Yêu cầu bài toán
Input: Một đoạn văn bản (bài luận), đề bài tương ứng, có thể dùng thêm mô tả hình ảnh.
Output: Một con số thực đại diện cho điểm số dự đoán của bài luận đó.
Thách thức: Mô hình cần hiểu được ngữ nghĩa sâu, cấu trúc câu, từ vựng và độ mạch lạc của văn bản để đưa ra điểm số chính xác.
4. Tiêu chí đánh giá (Evaluation Metrics)
Hiệu năng của mô hình được đánh giá dựa trên mức độ khớp giữa điểm máy chấm và điểm người chấm:
MAE (Mean Absolute Error): Sai số tuyệt đối trung bình. Đây là chỉ số duy nhất được sử dụng để đánh giá mô hình, cho biết trung bình máy chấm lệch bao nhiêu điểm so với giám khảo.
Evaluation Criteria
Scoring Metric
MAE (Mean Absolute Error)
Lower is Better ↓
Average absolute difference between predictions and actual values (for regression)
Submission Format
CSV File
Maximum file size: 5MB
Top Participants
#1Lực Hướng Tâm
0.4119#2Mango
0.4125#3Tuianhchaphet
0.4175#4kothanglamcho
0.4264#5beebee
0.4287