Data mining prin crowdsourcing, pe seturi de date nestructurate

In general, prin data mining intelegem acel proces de analiza a datelor din diverse perspective, pentru extragerea de informatii utile, informatii ce se pot utiliza pentru optimizarea unor indicatori de performanta, precum cresterea volumului vanzarilor sau scaderea costurilor. Practic se urmareste identificarea unor corelatii intre diverse dimensiuni redate prin informatiile existente.
De cele mai multe ori, modul in care datele sunt colectate sau origanizate ulterior permite utilizarea unor programe speciale de data mining, precum Angoss, RapidMiner, Knime, Weka si altele. Prin folosirea unor algoritmi de machine learning, astfel de programe pot ajunge chiar sa „inteleaga” anumite tipare si sa le aplice in selectia informatiilor. Atunci cand este posibila din punct de vedere tehnic utilizarea unei astfel de solutii, lucrurile sunt de obicei simple si problema se rezuma la costuri (licenta pentru program si specialistul care-l poate utiliza).
De multe ori insa o companie se afla in situatia de a analiza un set de date nestructurate, sau pe care un algoritm nu le-ar putea procesa in mod eficient, dar care pentru un operator uman sunt usor de realizat. Spre exemplu dintr-o singura imagine a unei rochii, un om poate spune foarte usor ce culoare are, daca este lunga sau scurta, daca are spatele gol, daca are nasturi sau fermoar, daca are un imprimeu etc. Tot ca exemplu, o persoana poate analiza un clip video si sa observe daca in el se intampla sau nu o anumita actiune, mult mai usor decat un algoritm.
Prin crowdsourcing, analistii de date si companiile au practic acces la o multime de oameni ce pot sa constribuie la procesarea datelor existente. Iata cum functioneaza sistemul si tehnologia prin care se poate face data mining prin crowdsourcing, pe seturi de date nestructurate, in Romania:
Pentru exemple de proiecte de crowdsourcing deja realizate in Romania prin tehnologia de care dispunem, accesati sectiunea de studii de caz existenta pe acest blog. Daca doriti sa analizam impreuna cum ar putea o solutie de crowdsourcing sa va ajute in procesarea datelor, ne puteti contacta folosind informatiile de pe site-ul DWF.