Project Description
Hvad går projektet ud på?
Projektet er lavet i forbindelse med DTU kursus 02806. Kurset har til formål at indsamle, analysere og visualisere data som kan findes på internettet. Informationerne er hentet ved brug af Python og visualiseret i JavaScript og Html. Løsningen henter samtlige artikler fra de valgte danske nyheds sider og analyserer deres “sentiment” samt finder hvilke emner der diskuteres i Danmark lige nu!
Hvordan udregnes negativ- og positiv-scoren (sentiment)?
Sentiment scoren er den som fortæller hvorvidt en artikel er positiv eller negativt ladet. Dette gøres ud fra en ord-liste konstrueret af Finn Årup Nielsen. Denne liste indeholder en bred vifte af ord og deres positiv/negativ score. En høj score betyder en positiv score.
Den gennemsnitslige sentiment-score bliver beregnet ved at samle scoren for samtlige overskrifter på hjemmesiderne, hvorefter den samlede score bliver udregnet.
Hvilke sider bliver undersøgt?
Project Details
- Date maj 16, 2015
- Tags Data Mining, Machine Learning, User Experience, Web Development
Comments are closed.