Skip to main content
Public Test Phaseteam4-phase

PAIC 2026 - PTNK AI Challenge 2026

Kì thi AI do cộng đồng The Noders PTNK tổ chức cho đối tượng học sinh cấp 3.

Teams: 1-3 members
Metric: MAE (Mean Absolute Error)
54 participants

Public test ends in

--Days
:
--Hours
:
--Minutes
:
--Seconds

Competition Timeline

Registration Period

Jan 4, 2026Jan 4, 2026
Duration: 1 days

Public Test Phase

Jan 4, 2026Jan 17, 2026
Duration: 13 days

Private Test Phase

Jan 17, 2026Jan 18, 2026
Duration: 1 days

Problem Statement

Problem Statement 1. Tổng quan bài toán Mục tiêu của dự án là xây dựng một hệ thống chấm điểm tự động (Automated Essay Scoring - AES) cho các bài luận IELTS, sử dụng các kỹ thuật Xử lý Ngôn ngữ Tự nhiên (NLP) và Deep Learning tiên tiến. Hệ thống này nhằm hỗ trợ người học đánh giá năng lực viết của mình một cách nhanh chóng và khách quan. 2. Dữ liệu huấn luyện (Training Data) Tập dữ liệu bao gồm các bài thi viết IELTS thực tế, với cấu trúc chính như sau: - Prompt (Đề bài): Chủ đề hoặc câu hỏi mà thí sinh cần giải quyết. - Image Description (Mô tả hình ảnh): Mô tả chi tiết về biểu đồ hoặc hình ảnh trong đề bài Writing Task 1 (hiện tại chưa được sử dụng trong mô hình nhưng có sẵn trong dữ liệu). - Essay (Bài làm): Nội dung văn bản bài luận do thí sinh viết. - Overall Score (Nhãn): Điểm số tổng kết (Band Score) do giám khảo con người chấm, nằm trong thang điểm từ 1.0 đến 9.0. - Điểm thành phần cho từng mục Tash Response, Lexical Resource, Coherence and Cohesion và Grammar Range and Accuracy. 3. Yêu cầu bài toán Input: Một đoạn văn bản (bài luận), đề bài tương ứng, có thể dùng thêm mô tả hình ảnh. Output: Một con số thực đại diện cho điểm số dự đoán của bài luận đó. Thách thức: Mô hình cần hiểu được ngữ nghĩa sâu, cấu trúc câu, từ vựng và độ mạch lạc của văn bản để đưa ra điểm số chính xác. 4. Tiêu chí đánh giá (Evaluation Metrics) Hiệu năng của mô hình được đánh giá dựa trên mức độ khớp giữa điểm máy chấm và điểm người chấm: MAE (Mean Absolute Error): Sai số tuyệt đối trung bình. Đây là chỉ số duy nhất được sử dụng để đánh giá mô hình, cho biết trung bình máy chấm lệch bao nhiêu điểm so với giám khảo.

Evaluation Criteria

Scoring Metric

MAE (Mean Absolute Error)

Lower is Better ↓

Average absolute difference between predictions and actual values (for regression)

Submission Format

CSV File

Maximum file size: 5MB

Top Participants

#1Lực Hướng Tâm
0.4119
#2Mango
0.4125
#3Tuianhchaphet
0.4175
#4kothanglamcho
0.4264
#5beebee
0.4287