Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

Deep Learning (in Machine Learning) for Data Science, Lab Reports of Machine Learning

Report lab for Deep Learning (in Machine Learning) for Data Science

Typology: Lab Reports

2023/2024

Uploaded on 02/23/2025

lam-nguyen-52
lam-nguyen-52 🇻🇳

1 document

1 / 5

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
BÁO CÁO THỰC HÀNH 1
PHÂN LỚP VĂN BẢN SỬ DỤNG PRE-TRAINED WORD EMBEDDING
Thông tin chung:
Bộ dữ liệu: UIT-VSFC
Công bố khoa học: K. V. Nguyen, V. D. Nguyen, P. X. V. Nguyen, T. T. H. Truong and N. L.
Nguyen, "UIT-VSFC: Vietnamese Students’ Feedback Corpus for Sentiment Analysis", KSE
2018.
Số lượng dữ liệu: Khoảng hơn 16,000 câu
Bộ pre-trained embedding sử dụng: FastText_ner.vec
Nguồn pre-trained embedding: FastText_ner.vec
Kích thước embedding: 300 chiều
Bài 1: Phân tích cảm xúc (Sentiment-based)
Mô tả bài toán:
Phân loại cảm xúc dựa trên văn bản phản hồi của sinh viên, với 3 nhãn: tích cực (positive), tiêu cực
(negative) và trung tính (neutral).
Kết quả:
F1 score (Macro): 0.6903
Accuracy: 88.56%
Mô hình sử dụng:
Mô hình neural network với 1 lớp embedding (pre-trained), lớp Flatten, và lớp đầu ra dùng hàm kích
hoạt sigmoid.
Sử dụng pre-trained word embedding FastText_ner.vec.
Visualizations:
1. Biểu đồ Accuracy và Loss:
pf3
pf4
pf5

Partial preview of the text

Download Deep Learning (in Machine Learning) for Data Science and more Lab Reports Machine Learning in PDF only on Docsity!

BÁO CÁO THỰC HÀNH 1

PHÂN LỚP VĂN BẢN SỬ DỤNG PRE-TRAINED WORD EMBEDDING

Thông tin chung:  Bộ dữ liệu: UIT-VSFC  Công bố khoa học: K. V. Nguyen, V. D. Nguyen, P. X. V. Nguyen, T. T. H. Truong and N. L. Nguyen, "UIT-VSFC: Vietnamese Students’ Feedback Corpus for Sentiment Analysis", KSE

 Số lượng dữ liệu: Khoảng hơn 16,000 câu  Bộ pre-trained embedding sử dụng: FastText_ner.vec  Nguồn pre-trained embedding: FastText_ner.vec  Kích thước embedding: 300 chiều Bài 1: Phân tích cảm xúc (Sentiment-based) Mô tả bài toán: Phân loại cảm xúc dựa trên văn bản phản hồi của sinh viên, với 3 nhãn: tích cực (positive), tiêu cực (negative) và trung tính (neutral). Kết quả:  F1 score (Macro): 0.  Accuracy: 88.56% Mô hình sử dụng:  Mô hình neural network với 1 lớp embedding (pre-trained), lớp Flatten, và lớp đầu ra dùng hàm kích hoạt sigmoid.  Sử dụng pre-trained word embedding FastText_ner.vec. Visualizations:

1. Biểu đồ Accuracy và Loss:

**2. Confusion Matrix:

  1. F1-Score cho từng lớp:
  2. ROC Curve**

**3. F1-Score cho từng lớp:

  1. ROC Curve**

Kết luận: Cả hai bài toán đều sử dụng cùng một bộ pre-trained embedding FastText_ner.vec với kích thước 300 chiều. Mô hình hoạt động tốt trên cả hai tác vụ với độ đo F1 scoreAccuracy cao. Tuy nhiên, vẫn có thể cải thiện kết quả bằng cách tinh chỉnh mô hình hoặc thử nghiệm các phương pháp tối ưu khác. Các biểu đồ trực quan hóa quá trình huấn luyện và đánh giá giúp quan sát và điều chỉnh mô hình một cách hiệu quả.