# NLP Instellingen

{% hint style="warning" %}
Opgelet! Dit is een geavanceerde feature. Bij verkeerde instellingen kan je er voor zorgen dat je bot intenties niet meer juist herkent.
{% endhint %}

De NLP Instellingen geven je controle over hoe je chatbot intenties herkent.

![](/files/-M-92w0_1Lpv34AaE4sU)

Je kan de volgende zaken aanpassen:

* **Behoud entiteitwaarden voor intentherkenning:** normaal zal Oswald bij het herkennen van een intentie de tekst van een entiteit vervangen door de naam van de entiteit. Wanneer je bijvoorbeeld de zin `ik wil op reis naar Parijs` ingeeft zal de bot herkennen dat `Parijs` een synoniem is voor de entiteit `bestemming:Paris` met naam `bestemming` en waarde `Paris`. Om de intentie te herkennen zal de zin vertaald worden naar `ik wil op reis naar bestemming`. Dat kan betere resultaten geven omdat de bot niet te specifiek naar de waarden zal kijken en dus beter kan generaliseren. Bekijk het als 'de bot moet niet leren dat de intentie `op reis gaan` gebonden is aan de waarde `Paris`, gelijk welke bestemming is goed'. Wanneer je de entiteit waarden behoudt, wordt de zin vervangen door `ik wil op reis gaan naar bestemming Paris`. Dat kan nuttig zijn als je bij verschillen de waarden een andere intentie wil herkennen.
* **Verstreng datumherkenning:** de bot kan soms iets te snel een datum herkennen. Wanneer je deze setting aan zet wordt een datum enkel herkend wanneer er zowel dag, maand als jaar gegeven wordt.
* **Vectorisatie:** de manier waarop een vector wordt gemaakt van de zin. Een vector is een wiskundige voorstelling van de tekst. Dit kan gebeuren op basis van opeenvolgingen van characters, opeenvolgingen van woorden of op basis van [sentence embeddings](https://en.wikipedia.org/wiki/Sentence_embedding).
* **Classificatie:** de manier waarop Oswald een intent probeert te herkennen vanuit de vectoren die uit de tekst gegenereerd worden. Dit kan gaan om:
  * **Naive Bayes:** dit werkt goed wanneer er weinig trainingszinnen zijn. We raden niet aan om dit in productie te gebruiken.
  * **SVM:** support vector machines. Dit werkt erg goed, maar wanneer er veel trainingszinnen zijn kan het lang duren voordat de bot hertraind is.
  * **SGD:** Stochastic Gradient Descent. Dit is een stochastische methode die er voor zorgt dat er snel een goede classificatie gevonden kan worden, ook al is deze mogelijk niet optimaal. Deze oplossing geeft goede resultaten wanneer er veel trainingszinnen zijn en komt toch snel tot een oplossing.
  * **Adaptive:** dit zorgt voor een combinatie van de vorige aanpakken. Naar gelang het aantal trainingszinnen kiest de bot een andere aanpak.
* **Regularisatie:** dit is een waarde van 0 (niet inclusive) tot en met 1000000. Hoe hoger, hoe minder specifiek de chatbot zal trainen. Een minder specifiek getrainde chatbot kan betere resultaten geven op input die de chatbot nog niet heeft gezien omdat de chatbot dan de input die hij al kent minder 'van buiten heeft geleerd'.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://oswaldai.gitbook.io/docs/functionele-documentatie/overige-functionaliteiten/nlp-instellingen.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.