Ví dụ thực tế có ứng dụng khai thác dữ liệu

Trong thời buổi Internet bùng nổ mạnh mẽ như ngày nay. Dữ liệu do con người tạo ra ngày càng nhiều hơn về số lượng; tăng nhanh về khối lượng. Vì vậy để phân loại là sử dụng dữ liệu đang gặp nhiều khó khăn. Data mining chính là giải pháp hữu dụng giúp giải quyết vấn đề này. Hãy cùng chúng tôi tìm hiểu về Data mining là gì nhé!

Data mining là gì?

Trên lý thuyết "Data Mining" là "quá trình khai phá", trích xuất, khai thác; và sử dụng những dữ liệu có giá trị tiềm ẩn từ bên trong lượng lớn dữ liệu được lưu trữ trong các cơ sở dữ liệu. Tuy nhiên, có thể hiểu một cách đơn giản Data Mining là một công đoạn trong hoạt động “làm sạch” dữ liệu; giúp cho dữ liệu được truyền dẫn một cách nhanh nhất.

Tính năng của giải pháp khai phá dữ liệu

Được tích hợp nhiều công nghệ hiện đại và tiên tiến, Data mining không chỉ giới hạn trong việc trích xuất dữ liệu; mà còn được sử dụng để chuyển đổi, làm sạch, tích hợp dữ liệu và phân tích mẫu. Sau đây chúng tôi sẽ liệt kê một số tính năng ưu việt nhất mà Data mining có được:

  • Dự đoán các mẫu dựa trên xu hướng trong dữ liệu.
  • Tính toán dự đoán kết quả
  • Tạo thông tin phản hồi để phân tích
  • Tập trung vào cơ sở dữ liệu lớn hơn.
  • Phân cụm dữ liệu trực quan

Ứng dụng của Data mining trong thực tế

Lợi ích chính mà người dùng nhận thấy ở Data mining nằm ở khả năng phát hiện các mẫu và mối liên hệ tiềm ẩn trong cơ sở dữ liệu. Nó có giá trị sử dụng trong việc đưa ra các dự đoán tác động đến hoạt động kinh doanh của doanh nghiệp. Data mining được ứng dụng linh hoạt trong các lĩnh vực khác nhau nhằm mục đích:

  • Phân tích thị trường và chứng khoán
  • Phát hiện gian lận
  • Quản lý rủi ro và phân tích doanh nghiệp
  • Phân tích giá trị trọn đời của khách hàng
  • Khám phá thêm 10 ứng dụng khai phá dữ liệu

Để giúp các bạn dễ dàng hình dung về ứng dụng của Data mining, chúng tôi sẽ lấy 1 số ví dụ sau. Các công ty trong ngành tài chính sử dụng các công cụ data mining để xây dựng các mô hình phát hiện rủi ro và gian lận. Hay lĩnh vực sản xuất công nghiệp lại sử dụng nguồn lực này cho cải thiện an toàn sản phẩm, xác định các vấn đề về chất lượng,...

Tổng hợp các công cụ khai phá dữ liệu hiện nay

Ngoài Data mining, thị trường hiện nay còn xuất hiện hàng loạt các công cụ đắc lực giúp khai thác triệt để dữ liệu.

RapidMiner

Nằm trong Top dẫn đầu, RapidMiner là một trong các công cụ được dùng phổ biến nhất để khai phá dữ liệu. Công cụ này được viết trên nền tảng Java nhưng không yêu cầu mã hóa để vận hành. RapidMiner chuyên cung cấp các chức năng khai thác dữ liệu như: biểu diễn dữ liệu, lọc, tiền xử lý dữ liệu, phân cụm…

Weka

Tương tự như RapidMiner, Weka không yêu cầu mã hóa và sử dụng GUI đơn giản. Nó có thể cung cấp một loạt các công cụ như: trực quan hóa, tiền xử lý, phân loại, phân cụm…

KNime

Có phần nổi trội hơn bởi khả năng hoạt động vô cùng mạnh mẽ. KNime hỗ trợ người dùng rất nhiều trong việc xử lý; và phân tích dữ liệu, trích xuất, chuyển đổi và tải dữ liệu.

Apache Mahout

Từ nền tảng Big Data Hadoop, người ta đã cho cho ra đời thêm Apache Mahout. Với mục đích giải quyết nhu cầu ngày càng tăng về khai phá dữ liệu. Nó được trang bị nhiều chức năng học máy khác nhau như phân loại, hồi quy, phân cụm,...

Kết lại

Nếu bạn đang trăn trở khi xử lý một nguồn dữ liệu lớn Big Data thì Data mining chính là giải pháp ưu việt nhất. Giúp bạn không mất quá nhiều thời gian, chi phí cho nhân lực và duy trì hoạt động. Mong rằng những thông tin hữu ích Data Mining là gì? mà chúng tôi vừa chia sẻ sẽ hỗ trợ bạn trong công việc. Chúc các bạn thành công!

Post View: 924

11KHAI THÁC DỮ LIỆU & ỨNG DỤNG[DATA MINING]GV : NGUYỄN HOÀNG TÚ ANH2ÔN TẬP233HÌNH THỨC KIỂM TRA VÀ ĐÁNH GIÁ• Hệ thống thang điểm :– Bài thi lý thuyết : 7 điểm– Bài tập theo nhóm : 1.5 điểm– Bài kiểm tra giữa kỳ : 1.5 điểm4Cấu trúc đề thi cuối kỳ 1. Thời gian : 120’2. Được sử dụng tài liệu, không sử dụngLaptop.3. Đề thi gồm 3 câua] Câu 1[3 điểm]: nội dung thuộc chương 3: Tập phổ biến và luật kết hợp.b] Câu 2 [3 điểm]: nội dung thuộc chương 4và 5 : Phân lớp, gom nhómc] Câu 3 [1điểm]: câu hỏi dạng phân tích,tổng hợp từ kiến thức của tất cả cácchương.35ÔN TẬP Chương 1 :1. Khai thác dữ liệu là gì? Quá trình không tầm thường của việc xácđịnh các mẫu tiềm ẩn có tính hợp lệ, mới lạ,có ích và có thể hiểu được tối đa trongCSDL.2. Nguyên nhân nào dẫn đến sự cần thiết củalĩnh vực khai thác dữ liệu ? Sự phát triển của công nghệ phần cứng,công nghệ thu thập & quản lý DL, các thuậttoán phát triển mạnh. Nhu cầu phân tích dữ liệu để hỗ trợ quátrình ra quyết định.6ÔN TẬP Chương 1 :3. Các kiểu dữ liệu và các loại thông tin nào cóthể được sử dụng trong quá trình khám phátri thức từ dữ liệu [KDD]? Các loại thông tin : thông tin thương mại,sản xuất, khoa học và thông tin cá nhân. Các kiểu dữ liệu : DL có thuộc tính dạng phisố, dạng liên tục, DL dạng tĩnh, động, DLphân tán, DL văn bản, web, đa phương tiện:hình ảnh, audio, video, …4. Trình bày một vài ví dụ thực tế có sử dụngloại dữ liệu, thông tin đã nêu trên. www.kdnuggets.com/solutions/index.html47ÔN TẬP Chương 1 :5. Khai thác dữ liệu gồm các loại nhiệmvụ nào? Nhiệm vụ mô tả và dự đoán. Dựa trên kinh nghiệm bản thân, theo cácem loại nhiệm vụ nào của khai thác dữliệu được quan tâm nhiều nhất và đượcứng dụng nhiều trong : Lĩnh vực kinh doanh Lĩnh vực giáo dục8Chương 2 :6. Tại sao cần chuẩn bị DL? Do chất lượng DL trong thực tế là xấu. Chất lượng DL sẽ ảnh hưởng đến quá trìnhra quyết định.7. Các bước trong quá trình chuẩn bị DL ? Choví dụ cụ thể từng bước. Làm sạch DL -> Chọn lọc/ Tích hợp DL ->Biến đổi/ mã hóa DL -> Rút gọn DL8. Phương pháp chia giỏ, phương pháp sử dụngbiểu đồ [histogram] có thể áp dụng vàotrong các bước nào của quá trình chuẩn bịdữ liệu ? Làm sạch DL : khử nhiễu; Mã hóa DL : rờirạc hóa DL; Rút gọn DL .ÔN TẬP59ÔN TẬP Chương 3 :9. Phát biểu bài toán khai thác tập phổ biến,khai thác luật kết hợp?Bài toán khai thác tập phổ biến là bàitoán tìm tất cả các tập các hạng mục S[hay tập phổ biến S] có độ phổ biến thỏamãn độ phổ biến tối thiểu minsupp:supp[S] minsuppBài toán khai thác LKH là bài toán tìm tất cảcác luật dạng X  Y [X, Y  I và X Y = {}]thỏa mãn độ phổ biến và độ tin cậy tối thiểusupp [X  Y ]  minsuppconf [X  Y ]  minconf10ÔN TẬP Chương 3 :10. Trình bày các tính chất của tập phổ biến?Tập phổ biến tối đại, tập phổ biến đóng.Tất cả các tập con của tập phổ biến đều làtập phổ biến .Nếu tập con không phổ biến thì tập bao nó[tập cha] không phổ biến.Tập phổ biến tối đại : là tập phổ biến &không tồn tại tập nào bao nó là phổ biếnTập phổ biến đóng: là tập phổ biến & khôngtồn tại tập nào bao nó có cùng độ phổ biếnnhư nó.

TRƯỜNG ĐẠI HỌC THỦ DẦU MỘTKHOA CÔNG NGHỆ THÔNG TINCÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG CỦA KHAI PHÁ DỮ LIỆUNHÓM THỰC HIỆN:1. Phạm Thị Nhung.2. Lê Thị Sáu.3. Lê Lữ Hoàng Nhựt Ánh.4. Nguyễn Thị Thu Thủy.5. Võ Thị Huê1. NHU CẦU KHAI PHÁ DỮ LIỆUSỰ BÙNG NỔ THÔNG TIN! Nhiều dữ liệu được sinh thêm: Web, văn bản, ảnh … Giao dịch thương mại, cuộc gọi,  DL khoa học: thiên văn, sinh học … Thêm nhiều dữ liệu được nắm giữ: Công nghệ lưu giữ nhanh hơn và rẻ hơn. Hệ quản trị CSDL có thể quản lý các cơ sở dữ liệu với kích thước lớn hơn.• Vấn đề bùng nổ dữ liệuCác tiện ích thu thập dữ liệu tự động và công nghệ cơ sở dữ liệu lớn mạnh dẫn tớimột lượng lớn dữ liệu được tích lũy và/hoặc cần được phân tích trong cơ sở dữ liệu, khodữ liệu và trong các nguồn chứa dữ liệu khác.• Chúng ta bị ngập lụt trong dữ liệu mà khát tri thức! Giải pháp: Kho dữ liệu và Khai phá dữ liệu [mining]Tạo lập kho dữ liệu và quá trình phân tích dữ liệu trực tuyến OLAP.Khai phá tri thức hấp dẫn [luật, quy luật, mẫu, ràng buộc] từ dữ liệu trong CSDL lớn.2. KHAI PHÁ DỮ LIỆU LÀ GÌ?Theo J.Han và M.Kamber [2006] [1]:Quan niệm 1:Khai phá dữ liệu [Data Mining] là quá trình trích chọn ra tri thức từ trong một tậphợp rất lớn dữ liệu.Khai phá dữ liệu = Phát hiện tri thức từ dữ liệu [KDD: Knowledge DiscoveryFrom Data].Quan niệm 2:Khai phá dữ liệu [Data Mining] chỉ là một bước quan trọng trong quá trình pháthiên tri thức từ dữ liệu [KDD].3. CÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU ĐIỂN HÌNHMục tiêu tổng quát của khai phá dữ liệu là mô tả và dự báo Bài toán mô tả: hướng tới việc tìm ra các mẫu mô tả dữ liệu. Bài toán dự báo: sử dụng một số biến [hoặc trường] trong cơ sở dữ liệu để dựđoán về giá trị chưa biết hoặc giá trị sẽ có trong tương lai của các biến.⟹ Thể hiện thông qua các bài toán cụ thể:1. Mô tả khái niệm2. Quan hệ kết hợp3. Phân cụm4. Phân lớp5. Hồi quy6. Mô hình phụ thuộc7. Phát hiện thay đổi và độ lệch3.1. Mô tả khái niệm Nhằm tìm ra các đặc trưng và tính chất của khái niệm.  Các bài toán điển hình bao gồm: tổng quát hóa, tóm tắt, phát hiện các đặc trưngdữ liệu ràng buộc,…Bài toán tóm tắt là một trong những bài toán mô tả điển hình, áp dụng các phươngpháp để tìm ra một mô tả cô đọng đối với một tập con dữ liệu. Ví dụ: xác định kỳ vọngvà độ lệch chuẩn của một dãy các giá trị.3.2. Tìm quan hệ kết hợp Phát hiện mối quan hệ kết hợp trong tập dữ liệu là bài toán quan trọng trong khaiphá dữ liệu. Một trong những mối quan hệ kết hợp điển hình là quan hệ kết hợp giữa các biếndữ liệu trong đó bài toán khai phá luật kết hợp là một bài toán tiêu biểu.Bài toán khai phá luật kết hợp thực hiện việc phát hiện ra mối quan hệ kết hợp giữacác tập thuộc tính [các tập biến] có dạng X⟶Y, trong đó X và Y là hai tập thuộc tính.“Sự xuất hiện của X kéo theo sự xuất hiện của Y như thế nào?”3.3. Phân lớp Thực hiện việc xây dựng [mô tả] các mô hình [hàm] dự báo nhằm mô tả hoặc pháthiện các lớp hoặc khái niệm cho các dự báo tiếp theo. Một số phương pháp điển hình là: cây quyết định, luật phân lớp, mạng neuron,… Nội dung của phân lớp chính là một hàm ánh xạ các dữ liệu vào trong một số cáclớp [nhóm] đã biết.  Phân lớp còn được gọi là “học máy có giám sát” [supervised learning].3.4. Phân cụm Thực hiện việc nhóm dữ liệu thành các “cụm” [có thể coi là một lớp mới] để cóthể phát hiện được các mẫu phân bố dữ liệu trong miền ứng dụng. Hướng tới việc nhận biết một tập hữu hạn các cụm hoặc các lớp để mô tả dữ liệu. Mục tiêu của phân cụm là cực đại hóa tính tương đồng giữa các phần tử trongcùng cụm và cực tiểu hóa tính tương đồng giữa các phần tử khác cụm. Phân cụm còn được gọi là “học máy không có giám sát” [unsupervised learning].3.5. Hồi quy Là bài toán điển hình trong phân tích thống kê và dự báo. Tiến hành việc dự đoán các giá trị của một hoặc một số biến phụ thuộc vào giá trịcủa một tập hợp các biến độc lập. Có thể quy về việc học một hàm ánh xạ dữ liệu nhằm xác định giá trị thực củamột biến theo một số biến khác.3.6. Mô hình phụ thuộc Hướng tới việc tìm ra một mô hình mô tả sự phụ thuộc có ý nghĩa giữa các biến. Bao gồm 2 mức: Mức cấu trúc của mô hình: thường dưới dạng đồ thị trong đó các biến là phụthuộc bộ phân vào các biến khác. Mức định lượng của mô hình: mô tả sức mạnh của tính phụ thuộc khi sử dụngviệc đo tính theo giá trị số.3.7. Phát hiện biến đổi và độ lệch Tập trung phát hiện hầu hết sự thay đổi có ý nghĩa dưới dạng độ đo đã biết trướchoặc giá trị chuẩn, cung cấp những tri thức về sự biến đổi và độ lệch cho ngườidùng. Thường được ứng dụng trong bước tiền xử lý. 4. ỨNG DỤNG CỦA KHAI PHÁ DỮ LIỆUKhai phá dữ liệu được vận dụng trong nhiều lĩnh vực khác nhau nhằm khai thácnguồn dữ liệu phong phú được lưu trữ trong các hệ thống thông tin. Tùy theo bản chấtcủa từng lĩnh vực, việc vận dụng khai phá dữ liệu có những cách tiếp cận khác nhau. Ngân hàng: Xây dựng mô hình dự báo rủi ro tín dụng. Tìm kiếm tri thức, quyluật của thị trường chứng khoán và đầu tư bất động sản. Thương mại điện tử: Tìm hiểu, định hướng thúc đẩy, giao tiếp với khách hàng.Phân tích hành vi mua sắm trên mạng và cho biết thông tin tiếp thị phù hợp với nhiều loạikhách hàng. Marketing: Phân tích nhu cầu khách hàng dựa trên mẫu dữ liệu mua bán hàng từđó xác định chiến lược kinh doanh, quảng cáo, kế hoạch sản xuất, … Khai phá dữ liệu cũng được vận dụng hiệu quả để giải quyết các bài toán phức tạptrong các ngành đòi hỏi kỹ thuật cao, như tìm kiếm mỏ dầu từ ảnh viễn thám, cảnh báohỏng hóc trong các hệ thống sản xuất, … Các kỹ thuật Khai phá dữ liệu đã được ápdụng thành công trong việc dự đoán tải sử dụng điện năng cho các công ty cung cấpđiện, lưu lượng viễn thông cho các công ty điện thoại, mức độ tiêu thụ sản phẩm chocác nhà sản xuất, giá trị của sản phẩm trên thị trường cho các công ty tài chính, … Ngoài ra, Khai phá dữ liệu còn được áp dụng cho các vấn đề xã hội như phântích các kết quả phòng chống và điều trị một số loại bệnh, phân tích tác hại của ma tuý,phát hiện tội phạm hay tăng cường an ninh xã hội, Việc vận dụng thành công đãmang lại những hiệu quả thiết thực cho các hoạt động diễn ra hàng ngày trongđời sống.  Phân tích dữ liệu và hỗ trợ quyết định Phân tích và quản lý thị trường Tiếp thị định hướng, quản lý quan hệ khách hàng [CRM], phân tích thói quen mua hàng, bán hàng chéo, phân đoạn thị trường. Phân tích và quản lý rủi ro Dự báo, duy trì khách hàng, cải thiện bảo lãnh, kiểm soát chất lượng, phân tích cạnh tranh. Phát hiện gian lận và phát hiện mẫu bất thường [ngoại lai] Ứng dụng khác Khai phá Text [nhóm mới, email, tài liệu] và khai phá Web. Khai phá dữ liệu dòng. Phân tích DNA và dữ liệu sinh học.Phân tích kinh doanh: Khai phá quá trìnhWMP Van der Aalst [2011]. Process Mining: Discovery, Conformance and Enhancementof Business Processes, Springer.Phát hiện gian lận và khai phá mẫu hiếm• Tiếp cận: Phân cụm & xây dựng mô hình gian lận, phân tích bất thường• Ứng dụng: Chăm sóc sức khỏe, bán lẻ, dịch vụ thẻ tín dụng, viễn thông. Bảo hiểm tự động: vòng xung đột Rửa tiền: giao dịch tiền tệ đáng ngờ Bảo hiểm y tế• Bệnh nghề nghiệp, nhóm bác sỹ, và nhóm chỉ dẫn• Xét nghiệm không cần thiết hoặc tương quan Viễn thông: cuộc gọi gian lận• Mô hình cuộc gọi: đích cuộc gọi, độ dài, thời điểm trong ngàyhoặc tuần. Phân tích mẫu lệch một dạng chuẩn dự kiến Công nghiệp bán lẻ• Các nhà phân tích ước lượng rằng 38% giảm bán lẻ là do nhân viên không trung thực Chống khủng bốỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG CÔNG CỤDỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊNAPPLICATION OF DATA MINING FOR BUILDING TOOL TO FORTHE LEARNING RESULTS OF STUDENTS1. Phân tích xây dựng mô hình Quá trình khai phá dữ liệu được tiến hành theo quy trình chuẩn, baogồm các bước thuthập, làm sạch, trích lọc, chuyển đổi dữ liệu về dạng phùhợp, ứng dụng kỹ thuật khai phá dữ liệu để xây dựng mô hình và đánh giákết quả thu được.Nguồn dữ liệu cho việc khai phá nhằm dự đoán kết quả học tập sẽđược thu thập từ nhiều nguồn dữ liệu khác nhau. Hồ sơ cá nhân của sinhviên đã nộp vào trường để dự tuyển được phân công nhập vào các bảng tínhexcel, bao gồm các thông tin như họ tên, ngày sinh, nơi sinh, phái, dân tộc,khu vực, điểm ưu tiên Ngoài hồ sơ mà thí sinh nộp vào trường, còn mộtnguồn dữ liệu quan trọng khác đó là dữ liệu từ kết quả thi tuyển hằng nămnhư số báo danh, khối thi, ngành chọn thi, điểm thi các môn, điểm ưu tiên,kết quả [Đậu, Hỏng].Nguồn dữ liệu quan trọng nữa, đó là thông tin kết quả học tập toànkhoá cũng như các môn học mỗi sinh viên chọn học ở mỗi học kỳ như: mãsinh viên, ngành học, môn học, kết quả Dữ liệu cần xử lý được thu thập từcác bộ phận quản lý. Vì vậy, dữ liệu có tính trung thực cao, hầu hết đều phảnánh đúng ngữ nghĩa. Tuy nhiên, do bộ phận quản lý hay thay đổi và hệ thốnglưu trữ quản lý thông tin sinh viên chưa được nâng cao, nên dữ liệu thu thậpkhông được liên tục theo thời gian, một số trường dữ liệu bị thiếu do việccập nhật ban đầu không đầy đủ hoặc chưa được nhập liệu. Từ đó loại bỏ racác bản ghi có trường dữ liệu bị thiếu hoặc bị trùng lặp, các môn học, ngànhhọc đều được quy ước mã. Kết quả, tác giả thu được gần 70.000 bản ghi vềđiểm tổng kết học phần và dữ liệu cá nhân, tuyển sinh cho hơn 2000 sinhviên thuộc hệ đào tạo chính quy bậc cao đẳng tại một trường cao đẳng ởMiền Trung.Dữ liệu trong các tệp excel đó được chuyển vào cơ sở dữ liệu trong hệquản trị Microsoft SQL Server 2008 R2 bằng chức năng Import. Sau đó,chúng được tổ chức dưới dạng có thể sử dụng để khai phá bằng cách thiết kếvà thực hiện các lệnh truy vấn SQL. Đối với dữ liệu cần thiết để thực hiện nghiên cứu là lộ trình học, takhông thể liệt kê và gắn với mỗi sinh viên bằng các truy vấn SQL đơn giản.Đề tài đề xuất xây dựng một công cụ riêng để thực hiện việc này bằng ngônngữ lập trình C#.2. Xây dựng ứng dụng dự đoán kết quả học tậpVới ý tưởng đã nêu, ứng dụng dự đoán kết quả học tập của sinh viênđược xây dựng Theo sơ đồ [Hình 1]Để trình diễn kết quả nghiên cứu, tác giả chỉ xây dựng giao diện dựđoán kết quả học tập như trong hình vẽ bên dưới và chỉ cho phép tư vấn chomột sinh viên. Khi triển khai ứng dụng, giao diện và chức năng sẽ được xâydựng tùy vào nhóm người dùng. Chẳng hạn, với người dùng là giảng viênchủ nhiệm hoặc các cấp quản lý, ứng dụng có thể liệt kê thông tin của tất cảcác sinh viên theo từng lớp, kết hợp với các lộ trình có thể, thực hiện dự báovà trên cơ sở đó cho phép tư vấn cho từng sinh viên trong lớp. Đối với sinhviên, giao diện sẽ được thiết kế trong một trang web để sinh viên có thể truycập từ xa.Khi người dùng chọn một lộ trình học, ứng dụng sẽ hiển thị chi tiết các mônhọc cùng với học kỳ của lộ trình học đó.Ngoài ra, hệ thống cho phép xem các mô hình đã được xây dựngnhằm hỗ trợ cho người dùng cuối là các nhà quản lý, không phải là các kỹthuật viên xây dựng mô hình. Ngoài ra, dữ liệu đào tạo trong cơ sở dữ liệu có thể được bổ sung theothời gian, mô hình đề xuất có thể sẽ không còn là tối ưu. Vì vậy, ứng dụngcung cấp chức năng cho phép người dùng cuối – các nhà quản lý cập nhậtmô hình. Để xây dựng ứng dụng với các chức năng đã nêu, tác giả đã tiến hànhnghiên cứu và sử dụng thư viện API do Microsoft cung cấp cùng với ngônngữ truy vấn khai phá dữ liệu DMX – Data Mining Extensions.3. Kết luận Để xây dựng được ứng dụng này phải nghiên cứu cơ sở lý thuyết liênquan đến ba kỹ thuật cây quyết định, luật kết hợp và Naïve Bayes, nghiêncứu quy trình triển khai ứng dụng khai phá dữ liệu. Ngoài ra, để xây dựngứng dụng này cũng tìm hiểu các vấn đề cơ bản về dịch vụ Microsoft SQLServer 2008 R2 Analysis Services và các công cụ liên quan. Với dữ liệu huấn luyện ban đầu, mô hình cho phép phân tích các yếutố ảnh hưởng đến kết quả học tập của sinh viên, mức độ tác động của từngyếu tố đầu vào, từ đó dự đoán được kết quả học tập cuối khóa của sinh viênqua việc kết hợp thông tin đầu vào và lộ trình học. Bên cạnh đó, chuyên đềcòn xây dựng được chương trình demo hiển thị các mô hình đã xây dựngđến người dùng cuối. Với việc triển khai hệ thống thử nghiệm cho thấy khả năng ứng dụngkết quả này trong việc dự đoán kết quả học tập của sinh viên. Hệ thốngkhông chỉ hỗ trợ cho sinh viên mà còn hỗ trợ cho giáo viên chủ nhiệm, cáckhoa chuyên ngành, phòng đào tạo và những ai quan tâm. + Đối với sinh viên: giúp cho sinh viên lựa chọn cho mình một lộtrình học phù hợp với điều kiện và năng lực của bản thân để đạt được kếtquả học tập tối ưu. + Đối với giáo viên chủ nhiệm: hỗ trợ cho giáo viên chủ nhiệm có thểtư vấn cho sinh viên trong việc chọn một lộ trình học phù hợp. + Đối với các khoa chuyên ngành và phòng đào tạo: hỗ trợ trong việcđánh giá chất lượng cho từng lộ trình học nhằm nâng cao, cải thiện hơn nữatrong việc xây dựng các lộ trình học để phù hợp với mọi điều kiện và nănglực của sinh viên.

Video liên quan

Chủ Đề