KNIME: het aangewezen grafische analytics platform

By Ruud de Bruijn 12 maanden agoNo Comments
Home  /  k2 marketing  /  KNIME: het aangewezen grafische analytics platform

KNIME: het aangewezen grafische analytics platform

U heeft ervoor gekozen om uw data-analyse voortaan te baseren op een grafische workflow omgeving. Grafische analytics: een goede keuze, maar wat nu? K2 Marketing heeft in ieder geval erg goede ervaringen met KNIME, en wel om deze 8 redenen.

Dit blog over KNIME is een vervolg op ‘De 7 voordelen van workflowgebaseerde analytics’ . Beide artikelen zijn gebundeld in een whitepaper. Dit document is hier te downloaden.

Een grafisch analyticsplatform biedt allerlei voordelen. Zoals ik al in mijn eerdere blog over workflowgebaseerde analytics aanhaalde, zijn de kracht, eenvoud, beheergemak, overdraagbaarheid en inzichtelijkheid voor derden belangrijke pluspunten ten opzichte van de haast heilig verklaarde R / Python-tandem.

Een bekende commerciële oplossing voor grafische workflowanalytics is SAS Enterprise Miner. Een zeer uitgebreid platform met een dito kostenplaatje. Minder bekend, maar daarom niet minder goed, is KNIME. Deze open source oplossing zag in 2004 het levenslicht in de farmaceutische industrie. Sindsdien is het uitgegroeid tot een zeer complete en veelzijdige oplossing met een actieve gebruikersgroep. Dat tegen een fractie van de kosten van de SAS-oplossing.

Gerenommeerd open source

KNIME is open source, maar heeft beslist niet het karakter van een ‘hobbyproject’. Zo bestempelt Gartner de oplossing als marktleider onder de grafische workflowtools, een plaats die het deelt met SAS Enterprise Miner. Ook wordt KNIME gebruikt door gerenommeerde instituten. Zo gebruikt de Duitse BW Bank de oplossing voor datamining van RSS-feeds.

Ook K2 Marketing werkt al jaren naar grote tevredenheid met KNIME. Maar wat maakt het pakket zo bijzonder en waardevol? Wat ons betreft zijn dat de volgende punten:

1. Gebruiksgemak en eenvoud

KNIME is ontwikkeld met gebruiksgemak in het achterhoofd. Zo maakt de software slim gebruik van kleuren om verschillende stadia in de analyticsworkflow te onderscheiden. Iedere node is bovendien voorzien van een ‘stoplicht’ dat in één oogopslag de status van de bewerking aangeeft.

Dat maakt de software ook bruikbaar voor professionals die niet kunnen bogen op een diepe kennis van en ervaring met statistiek, codeervaardigheden en kennis van complexe big-data-omgevingen. Ook handige datamarketeers kunnen met de software uit de voeten.

Dat maakt de drempel om te starten met big-data-analytics een stuk kleiner, en vergroot bovendien de overdraagbaarheid van projecten. Bovendien kan de business gemakkelijker ‘meekijken’ en de logica achter de processen volgen.

2. Een grote community staat klaar voor ondersteuning

In tegenstelling tot veel commerciële software heeft KNIME met onder andere het KNIME Forum een grote en zeer actieve gebruikerscommunity. Dat vloeit direct voort uit het opensourcekarakter van de software. Bij vragen en problemen wordt u op de fora doorgaans zeer persoonlijk en snel geholpen door een kundige gebruiker. Vaak heeft u sneller het juiste bruikbare antwoord of inzicht dan via een officiële helpdesk van de commerciële alternatieven.

Ook is er meer dan voldoende les- en trainingsmateriaal beschikbaar. Zo bevat het YouTube-kanaal KNIMETV tal van webinars en how-to’s om het leerproces te versnellen.

3. KNIME biedt volledige ondersteuning voor R en Python

Een groot voordeel van grafische workflowsoftware als KNIME is de eenvoud: de meest voorkomende analyticsfuncties zijn standaard aanwezig. Het bouwen van een workflow is voor het overgrote deel een kwestie van ‘drag & drop’.

Een veelgehoord argument tegen zo’n grafische aanpak is dat het de flexibiliteit ontbeert van programmeertalen als R en Python. Hiermee zijn de mogelijkheden wat betreft functionaliteit uiteraard slechts gelimiteerd door de creativiteit van de ontwikkelaar. Maar het mooie van KNIME is dat het deze talen volledig ondersteunt: R- en Python-scripts voegt u eenvoudig als een ‘KNIME-node’, waarmee het volledig geïntegreerd wordt met de bestaande workflow. Mist u ondanks de uitgebreide standaardfunctionaliteit van KNIME toch een specifieke functie, dan kunt u deze alsnog toevoegen.

Overigens is zelf coderen daarbij niet altijd noodzakelijk: de community’s van beide programmeertalen beschikken over tal van voorgeprogrammeerde standaardmodules voor uiteenlopende functies.

Een goed voorbeeld is het gebruik van SAS-bestanden binnen KNIME. De standaardoplossing biedt deze mogelijkheid niet, maar via een bestaande R-module is het opnemen van SAS-bestanden in uw bestaande workflow alsnog mogelijk.

4. De grafische omgeving stimuleert structurering en hergebruik

Het grafische karakter van KNIME zorgt voor een goed overzicht op uw analyticsprojecten. Dat kan zeker voor wie van een codegebaseerde omgeving komt tot allerlei nieuwe inzichten leiden. Bijvoorbeeld dat bepaalde stappen onnodig (zwaar) zijn, of dat bepaalde stappen beter vervangen, herhaald of samengevoegd kunnen worden.

Die overzichtelijkheid stimuleert op die manier efficiënt (her)gebruik van modules. Wellicht kunt u bepaalde stappen vervangen door ‘standaardwerk’ van de community. Precies daarom sluit KNIME zo goed aan bij organisaties die hun analyticsomgeving willen optimaliseren. Het maakt niet alleen bottlenecks inzichtelijk, maar biedt ook voldoende opties om deze te stroomlijnen.

5. Een goede balans tussen kosten en functionaliteit

De community-editie van KNIME bevat standaard alle analyticsfunctionaliteit die je redelijkerwijs mag verwachten van een modern analyticsplatform. Sterker nog: het aantal beschikbare features overstijgt zeer waarschijnlijk ruimschoots uw behoefte. SAS Enterprise Miner bevat niet per se minder functionaliteit, maar daar hangt een heel ander prijskaartje aan.

Neem bijvoorbeeld model comparison, voor het selecteren van de beste modellen via scoringskansen. Dit is in SAS Enterprise Miner weliswaar beschikbaar, maar daar betaalt u fors voor. Deze functionaliteit is in de gratis versie van KNIME gewoon standaard aanwezig.

Daarnaast kent de gratis versie van KNIME geen limiet op het aantal records dat je inleest. Ter vergelijking: bij Rapid Miner, een andere bekende analyticsoplossing, ondersteunt de communityversie het inlezen van maximaal 10.000 records. In veel situaties is deze limiet te krap. Ten slotte: een handige feature die wel in KNIME maar niet in SAS Enterprise Miner zit, is het kunnen runnen van individuele bewerkingen.

6. Geavanceerde samenwerkingsmogelijkheden en uitgebreid autorisatiesysteem

Naast de kosteloze versie kunt u ook kiezen voor de commerciële variant van KNIME. Die bevat alle analyticsfunctionaliteit, maar vult dat aan met diverse extra’s. Bijvoorbeeld geavanceerde samenwerkingsmogelijkheden. Met KNIME Collaboration Extensions krijgen gebruikers tegelijkertijd toegang tot dezelfde workflowoverzichten, en kunnen ze daarin tegelijkertijd werken.

Ook biedt de commerciële versie een uitgebreid autorisatiesysteem met meerdere niveaus, zodat uw teamleden precies dat kunnen wat van hen verwacht wordt. Daarnaast biedt de commerciële versie een schedulingoptie. Hiermee kunt u bijvoorbeeld iedere nacht volautomatisch een nieuwe scoring genereren waar u in de ochtend direct mee aan de slag kunt.

7. Een brede ondersteuning voor databronnen

KNIME is beslist niet kieskeurig als het gaat om formaten of databasetypen. Het ‘lust’ nagenoeg alles. Voor zaken die het standaard niet ondersteunt, zijn connectors beschikbaar. Big-dataspecifieke databases Hadoop en applicatieframeworks als Apache Spark vormen geen enkel probleem. Het ondersteunt daarnaast tal van datatypen en bestandsformaten.

8. Ook voor overstappers

Beschikt u al over een analyticsplatform, op basis van code zoals R en/of Python, of wellicht een ander grafisch workflowpakket? Ook dan is de overstap naar KNIME het overwegen waard. Natuurlijk: de switch naar een ander systeem vergt altijd ombouwwerk. Maar een overstap biedt ook inherente voordelen. Het biedt een uitgelezen kans om de efficiency van bestaande modellen aan te scherpen. Heel vaak zijn campagnes, selecties of analyses een aantal jaar geleden gemaakt. Het kan zijn dat bepaalde variabelen daarin nog niet zijn meegenomen, omdat deze toentertijd simpelweg niet aan de orde waren. Een ‘review met de kennis van nu’ is daarom verfrissend.

Iets voor uw organisatie?

Bent u geïnteresseerd in het beklimmen van de analyticsberg met KNIME als stevige thuisbasis? Onze K2 Intelligence & Analytics-specialisten adviseren u graag vrijblijvend over de mogelijkheden die KNIME biedt voor uw organisatie.

Categories:
  k2 marketing, marketing intelligence, open source
this post was shared 0 times
 000
About

 Ruud de Bruijn

  (2 articles)

Met meer dan 19 jaar ervaring op het gebied van analyses en adviserering vanuit de data (database- en data analyse) tracht ik te komen tot verbeteringen en procesoptimalisaties voor de opdrachtgever. Ik ben in staat een brug te slaan tussen de business kant (processen en klanten) en de gegevens kant, gefocused op de complete business context. Centrale vraag hierbij is steevast welke impact heeft het project/actie op de omgeving in de breedste zin van het woord. Markt- en klantdata om te zetten naar markt- en klantkennis voor de organisatie is voor mij een must. Anders leer je niets, neem je alleen maar waar. Maar dan wel de vertaling maken wat de organisatie met deze kennis daadwerkelijk kan. Dat is mijn aanpak. Luisteren naar de vraag achter de vraag helpt hierbij. Snel schakelen op zowel strategisch als operationeel vlak om tot resulaten te komen gaat mij natuurlijk af. De resultaten probeer ik altijd helder en zo beknopt mogelijk te vertalen naar concrete voorstellen en verbeteringen. Hierbij zal ik de opgedane kennis borgen voor de teamleden. Persoonskenmerken: communicatief sterk, analytisch en resultaat gericht, overtuigingskracht, bruggen slaan binnen complexe omgevingen, omgevingsensatief, coach en teamplayer en enthousiasmerend.

Leave a Reply

Your email address will not be published.