Tác giả :Nguyễn Thành Sơn
Nguyễn Thành Sơn -Trường Đại học Sư phạm Kỹ thuật TP.HCM

TÓM TẮT: Motif trong cơ sở dữ liệu chuỗi thời gian là các chuỗi lặp lại nhiều lần trong cơ sở dữ liệu chuỗi thời gian hoặc các chuỗi con lặp lại trong một chuỗi thời gian dài hơn. Phát hiện motif trên chuỗi thời gian là một công việc quan trọng trong khai phá dữ liệu chuỗi thời gian. Trong bài báo này, chúng tôi đề xuất một phương pháp phát hiện motif trên chuỗi thời gian dựa vào một cấu trúc chỉ mục đa chiều sử dụng vùng bao hình chữ nhật nhỏ nhất. Phương pháp do chúng tôi đề xuất hiệu quả về mặt thời gian xử lý lẫn không gian lưu trữ vì chỉ cần lưu các vùng bao nhỏ nhất của các chuỗi thời gian trong bộ nhớ chính và chỉ cần quét qua một lần toàn bộ cơ sở dữ liệu chuỗi thời gian cùng với môt vài lần đọc dữ liệu gốc từ đĩa để thẩm định lại kết quả. Chúng tôi minh họa tính hiệu quả của phương pháp đề xuất bằng thực nghiệm trên các tập dữ liệu thực thuộc các lĩnh vực khác nhau. Kết quả thực nghiệm cho thấy phương pháp đề xuất có thể phát hiện motif một cách hiệu quả hơn những phương pháp thông dụng, phương pháp chiếu ngẫu nhiên.
Từ khóa: Chuỗi thời gian, chỉ mục đa chiều, motif

ABSTRACT: Time series motifs are frequently occurring but unknown sequences in time series database or subsequences of a longer time series. Discovering time series motifs is a crucial task in time series data mining. In this paper, we examine a search method for discovering approximate motif in time series with the support of a multidimensional index structure based on Minimum Bounding Rectangles (MBR). Our method is time and space efficient because it only saves MBRs of data in the memory and needs a single scan over the entire time series database and a few times to read the original disk data in order to confirm the results. We demonstrate the effectiveness of our approach by experimenting on real datasets from different areas. The experimental results showed that our proposed method can effectively discover time series motifs as compared to the popular method, random projection.
Key words: Time series, Multi-dimensional index, motif
Toàn văn bài báo ( Thầy/cô vui lòng đăng nhập bằng email ...@hcmute.edu.vn để xem)
Góp ý
Họ và tên: *  
Email: *  
Tiêu đề: *  
Mã xác nhận:
 
 
   
  
 
 
   
 *
Copyright © Tạp Chí Khoa Học Giáo Dục Kỹ Thuật - Trường Đại Học Sư Phạm Kỹ Thuật - TP.HCM  
Địa chỉ: Phòng 601B, 1 Võ Văn Ngân, Quận Thủ Đức, Thành Phố Hồ Chí Minh. 
Điện thoại: 08-3722.1223 (8168)
Email:
tapchikhgdkt@hcmute.edu.vn

                                      
                                

Truy cập tháng: 20,858

Tổng truy cập:230,191