Using Data Mining To Prepare The Distance Education Site Content


ZİHNİ N. B. , TURHAN K. , ÇAN M. A.

International Teachers and Technologies Education Symposium, Trabzon, Türkiye, 26 - 28 Haziran 2013

  • Basıldığı Şehir: Trabzon
  • Basıldığı Ülke: Türkiye

Özet

Özellikle son yıllarda yaşanan teknolojik gelişmeler bilgi erişim hızında ve depolama kapasitelerinde artışları beraberinde getirmiştir. Gerek bilgi erişim hızının artması, gerekse veri depolama kapasitelerindeki artışlar özellikle Web üzerinden erişilebilen elektronik veritabanı uygulamalarının yaygınlaşmasını sağlamıştır.[1] Bilgisayar sistemlerinin her geçen gün hem daha ucuzluyor olması, hem de güçlerinin artıyor olması, bilgisayarlarda daha büyük miktarlarda verinin saklanabilmesine imkân vermektedir. Veri madenciliği bu gibi durumlarda kullanılan, büyük miktardaki veri setlerinde saklı durumda bulunan örüntü ve eğilimleri keşfetme işlemidir.[2]

İnsanlar çocukluk döneminde temel kavram tanımlarını şekillendirmede tümevarım yöntemini kullanırlar. Birey örneklere verilen isimleri işitir ve kavram özelliklerini tanımladığına inandığını seçerek sınıflama modelini oluşturur. Bu tür öğrenme “tümevarıma dayalı denetimli kavram öğrenme” veya kısaca “denetimli öğrenme” (supervised learning) olarak tanımlanır.[4]

Bu çalışmadaki problem site içeriğinde yer alması düşünülen anatomi resimleri üzerinde tanımlanması gereken kavramlara karşılık gelecek noktaların sahip olduğu özel durumlardır. Resim 1’de görülen anatomi resmi tüm veritabanını uygulanması düşünülen özel durumları içermektedir. Bu resim üzerinde belirlenen ve sınıflama yöntemi kullanılarak veri madenciliği yapılan örnekte yer alan özel durumlar şunlardır:

1) Tek nokta olma durumu: Resim üzerinde yer alan her bir noktaya karşılık gelen bir anatomi kavramı olması durumu olup en çok karşılaşılan durumudur. Örneğin dot20 gibi (Bkz. Resim 18).

2) Aynı kavrama karşılık gelen farklı noktalar: Bazı durumlarda resim üzerinde yer alan en az iki noktaya karşılık gelen anatomi kavramı aynıdır. Bu noktalar tabloya “*” karakteri ile kayıt edilmiştir. Örneğin dot23*,dot24* gibi (Bkz. Resim 19).

3) Ekranda noktası olmayıp kavram listesinde adı olan ve birden çok noktası olan kavramlar: Bu durum en az görülen durum olmasına rağmen öğrencilerin öğrenmesi gereken kavramları içerisinde barındırdığı için kod kısmına ilave edilmiştir. Bu tür kavramlara öğrenci resim üzerinde yer alan noktalar üzerinden ulaşamaz ancak kavram listesi üzerinden ulaşabilir. Bu tür kavramlara ait bilgiler tabloya tekli noktalar gibi kayıt edilmiştir. Örneğin dot9,dot13,dot23,dot24 gibi (buradaki yazılan beş noktanın hepsine ait bir kavram adı vardır ancak bu beş nokta bir araya geldiğinde farklı bir anatomik kavram adı almaktadırlar) (Bkz. Resim 20).

As computer systems getting cheaper and computer power increases, the amount of data available to be collected and processed increases. Data mining is a process, which is used in these cases for discovering patterns and trends in large datasets. In this study, describes a data mining application developed with using the classification model which is one of the data mining models. The developed application, is the process of transferring , the contents of one of the committees that is located in anatomy lesson which is in the curriculum of medical education, of the electronic media. Anatomy pictures used in the application which is opened access to students in the form of distance education. The images used in the application have anatomical terms that used to be known by the students. In total 116 images and 8918 dots has taken place. These points are recorded to the database is being classified in three groups according to the terms to which they correspond. Obtained from after looking through all the pictures three different states was determined as follows:

  1. Status of being a single point: In this case, each point on the image which has the concept of the anatomy is the most common situation. For example, as dot 20.
  2. Different spots corresponding to the same concept: In some cases, at least two points on the image corresponding to the anatomy of the same concept. This points has been registered  to the table with "*" character. For example, as dot23*,dot24*.
  3. Concept, which has no dot on the screen but has name on the concept list and has multiple dots: Although it is in this case at least have been added in the portion of code for the students to learn the concepts contained. Students can not reach out this type of concepts on the image but they can reach them through the list. This kind of information about the concepts were recorded to table such as single points. For example, as dot9,dot13,dot23,dot24 (all five points are shown in the example have the name of a concept but when this five point come together they get different anatomical concept name)

Learning objects used in the application receive  pictures and concept information from the database with the parameter. Then anatomical points are determined by the image processing performed on the image.

Points identified correspond to which of the above three conditions are available according to the information in the table “TbNokta”. If the number of points corresponding to the concept is one this corresponds to the initial state. If more than one points corresponds to concept and at the end point names "*" character is used, this corresponds to the second situation. If multiple points corresponds to concept and at the end point names "*" character is not used, this corresponds to the third situation.

Classification rules described above, is estimated to be adapted educational materials that make up the contents of the site.

It is thought to be formed by all of the site's content with only image which is used by training materials and to identify the point which are on without changing classification structure. Training materials developed for this purpose are opened to access for students. A survey implemented to students at the end of the study and they were asked to evaluate the site which they used. When feedbacks from students are examined it is seen that the classification is valid for the entire database and materials were working correctly.