FilmRecensies - Proof of Concept (PoC)

Overzicht

Deze Proof of Concept (PoC) demonstreert een Machine Learning-toepassing voor het classificeren van filmrecensies op basis van hun sentiment (bijvoorbeeld positief of negatief). Het project gebruikt de Weka-bibliotheek in een programmeeromgeving (Java) om classificatie te implementeren en te evalueren.

!Het model heeft een kleine dataset en kan daardoor minder nauwkeurig zijn!

Functionaliteiten

Classificatie van filmrecensies via drie modellen:
- NaiveBayes: Simpel, snel, en accuraat voor tekstuele data.
- RandomForest: Een krachtiger model voor complexe datasets.
- SVM: Goed voor het classificeren van tekstuele data.
Vergelijking van modelprestaties met metriek zoals nauwkeurigheid, Kappa-statistiek en fouten.

Resultaten

Hieronder staan de prestaties van de modellen op de dataset:

Metriek	NaiveBayes	RandomForest	SVM
Correct geclassificeerde voorbeelden	92.73%	78.18%	85.45%
Kappa-statistiek	0.8533	0.5417	0.7543
Gemiddelde absolute fout	0.0684	0.2676	0.1456
Root Mean Squared Error	0.2532	0.3525	0.3012

Conclusie

NaiveBayes presteert beter in termen van nauwkeurigheid en fouten, en wordt daarom aanbevolen voor dit project.
RandomForest biedt ruimte voor verbetering, bijvoorbeeld door hyperparameter tuning en datasetvergroting.
SVM presteert goed en kan een alternatief zijn afhankelijk van de dataset en vereisten.

Installatie & Vereisten

Vereisten

IDE: IntelliJ IDEA.
Java: JDK 21.

Installatiestappen

Open de zip van het project en pak deze uit.
Open het project in IntelliJ IDEA. Zorg ervoor dat de JDK 21 is geïnstalleerd.

(Heb je een andere versie van de JDK, dan kan je deze veranderen in de projectstructuur bij SDK's.)
Als je naar pom.xml gaat, verschijnt er een pop-up om de dependencies te importeren met Maven. Klik hierop en zodra de dependencies zijn geïmporteerd, is het project klaar voor gebruik.

Als IntelliJ niet automatisch vraagt om dependencies te importeren, kun je altijd handmatig de volgende stappen volgen:

Ga naar pom.xml ->
Maven Tool Window openen ->
Ga naar de rechterkant van je scherm en zoek het Maven Tool Window (een klein icon met het Maven-logo). ->
Herlaad alle Maven-projecten. ->
Klik op de knop "Reload All Maven Projects" (een kleine cirkelpijl helemaal links). ->
IntelliJ zal nu de dependencies downloaden en je project configureren.

Ga naar de StartApplication class en start de applicatie. Zodra dit is gelukt kan je naar het uitvoeren van de applicatie gaan.

Uitvoeren van de Applicatie

Start de applicatie door de StartApplication class uit te voeren.
De console vraagt om een modelkeuze, voer deze in.
- Voor NaiveBayes, voer NaiveBayes in.
- Voor RandomForest, voer RandomForest in.
- Voor SVM, voer SVM in.
Nu kan je filmrecensies invoeren en de classificatieresultaten bekijken.

Het model werkt beter met langere recensies zoals, "Een meesterwerk van begin tot eind! De mix van drama en humor was perfect."

Korte recensies zoals, "Slecht" of "Dit was zeer goed." kunnen minder nauwkeurig zijn. Als je ze toch wilt proberen, kan je dit doen, maar dan duurt het meerdere recensies voordat het model verbetert.

Je voert in of de classificatie correct is (ja/nee). Zo niet, corrigeer je de classificatie (positief/negatief).
Het model wordt opnieuw getraind met de feedback. Je kan altijd weer een recensie opnieuw invoeren om te zien of die het nu wel goed labeled. Na 10 recensies wordt er gevraagd om van model te wisselen. Je kan zelf kiezen of je dit doet of niet (ja/nee). Zo ja, dan kan je weer een model kiezen.
Je kan de applicatie stoppen door stop in te voeren.
Als je de applicatie stopt, eindigt de sessie. De nieuwe data wordt niet opgeslagen. Als je de applicatie opnieuw start, begint de sessie opnieuw en gebruikt het de standaarddata.

Evaluatie

Resultaten worden weergegeven in de console na het invoeren van een recensie.
De gebruiker kan de classificatie bevestigen of corrigeren.
Na het corrigeren van de classificatie wordt het model opnieuw getraind.
Bij het toevoegen van een nieuwe recensie wordt de classificatie weergegeven en na één of meerdere recensies wordt de machine learning verbeterd binnen een sessie.

Toekomstige Verbeteringen

Hyperparameter Tuning: Optimaliseer de RandomForest- en SVM-modellen door hyperparameters te tunen.
Meer Data: Verhoog de omvang van de trainingsdataset om de nauwkeurigheid van de modellen te verbeteren.
Data opslaan: Sla de nieuwe data op om de modellen te verbeteren en de prestaties te evalueren ipv. alleen binnen een sessie.
Alternatieve Modellen: Experimenteer met andere classifiers zoals Logistic Regression.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.idea		.idea
.mvn/wrapper		.mvn/wrapper
src/main		src/main
.gitignore		.gitignore
README.md		README.md
mvnw		mvnw
mvnw.cmd		mvnw.cmd
naiveBayesModel.model		naiveBayesModel.model
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FilmRecensies - Proof of Concept (PoC)

Overzicht

Inhoudsopgave

Functionaliteiten

Resultaten

Conclusie

Installatie & Vereisten

Vereisten

Installatiestappen

Uitvoeren van de Applicatie

Evaluatie

Toekomstige Verbeteringen

About

Releases

Packages

Languages

aamira0/FilmRevensiesPoC

Folders and files

Latest commit

History

Repository files navigation

FilmRecensies - Proof of Concept (PoC)

Overzicht

Inhoudsopgave

Functionaliteiten

Resultaten

Conclusie

Installatie & Vereisten

Vereisten

Installatiestappen

Uitvoeren van de Applicatie

Evaluatie

Toekomstige Verbeteringen

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages