Sentimentų analizė - „Excel“ patarimai

Sentimentų analizė „Excel“! Yra nemokamas „Microsoft Labs“ priedas, leidžiantis atlikti „sentimentų“ analizę „Excel“. Ką daryti, jei jūs turite apžvelgti šimtus apklausos komentarų, kad sužinotumėte, ką žmonės galvoja apie jūsų įmonę? „Excel“ gali priskirti tikimybę, parodančią kiekvieno komentaro teigiamą ar neigiamą poveikį.

Žiūrėti video

  • Apklausos duomenis lengva apskaičiuoti, kai jie yra kelių pasirinkimų
  • Norėdami sužinoti, kiek procentų turi kiekvienas atsakymas, galite naudoti suvestinę lentelę
  • Bet kaip su laisvos formos teksto atsakymais? Tai sunku apdoroti, jei jų turite šimtus ar tūkstančius.
  • Sentimentų analizė yra mašininis metodas prognozuoti, ar atsakymas yra teigiamas, ar neigiamas.
  • „Microsoft“ siūlo įrankį, kuris atlieka „sentimentų“ analizę programoje „Excel“ - „Azure Machine Learning“.
  • Tradicinei nuotaikos analizei reikia, kad žmogus išanalizuotų ir suklasifikuotų 5% teiginių.
  • Tradicinė nuotaikos analizė nėra lanksti - atstatysite kiekvienos pramonės šakos žodyną.
  • „Excel“ naudoja MPQA subjektyvumo leksiką (apie tai skaitykite http: // bit. Ly / 1SRNevt)
  • Šiame bendriniame žodyne yra 5097 neigiami ir 2533 teigiami žodžiai
  • Kiekvienam žodžiui priskiriamas stiprus arba silpnas poliškumas
  • Tai puikiai tinka trumpiems sakiniams, pvz., „Tweets“ ar „Facebook“ įrašams
  • Tai gali apgauti dvigubais neiginiais
  • Norėdami įdiegti, eikite į „Insert“, „Excel Store“, ieškokite „Azure Machine Learning“
  • Išvesties diapazonui nurodykite įvesties sritį ir du tuščius stulpelius.
  • Įvesties diapazono antraštė turi atitikti schemą: tweet_text
  • Papildomas straipsnis: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Vaizdo įrašo nuorašas

Sužinokite „Excel“ iš „Podcast“, 2062 serija: „Excel“ sentimentų analizė

Ei, tai buvo padėkos naktis, ir mes sėdėjome aplink moliūgų pyragą, o mūsų draugas Jesas pradėjo kalbėti apie „Twitter“ duomenų analizę. Aš pasakiau: „Ei, jūs žinote, kad„ Excel “gali atlikti nuotaikų analizę.“ Aš supratau, kad neturiu gero vaizdo įrašo nei apie šį, nei apie šį vaizdo įrašą, todėl šiame vaizdo įraše kalbama apie sentimentų analizę programoje „Excel“.

Dabar pirmiausia kyla klausimas, kas gi yra sentimentų analizė? O jei atliksite savo klientų apklausą ir jie galės pasirinkti kelis pasirinkimus, kur jie gali pasirinkti nuo 1 iki 5, tai tikrai labai lengva analizuoti. Galite tiesiog sukurti mažą suvestinę lentelę: čia įterpkite sukimo lentelę, Esamas darbalapis, spustelėkite Gerai. Mes norime sužinoti ten esantį klausimą arba atsakymą į klausimą ir tada, kiek atsakymų buvo kiekvienam, ir tai suteikia mums absoliutų skaičių. Jūs netgi galite čia užeiti ir pakeisti tai iš „Lauko nustatymai“ į „Rodyti vertes kaip viso stulpelio procentą“.

Gerai, todėl kiekvienam atsakymui galite pamatyti, kiek procentų žmonių gauna atsakymą. Gerai, bet nuotaikos analizė yra skirta, kai turite tikrai ilgą atsakymą, kur sakote: „Ei, gerai, gerai, tu žinai, papasakok, kodėl mums atsakei?“ Ir jie, žinote, vartoja sakinius ar pastraipas. Na, jei tokių turite šimtus ar tūkstančius, kažkam labai sunku tai išgyventi, perskaityti visus ir išsiaiškinti, kas vyksta, gerai?

Taigi yra dvi skirtingos nuotaikos analizės rūšys. Paprastai anksčiau naudojote žmogaus prižiūrimą mokymosi algoritmą. Taigi, jei turėjai 5000 atsakymų, žinok, 200 iš jų, išsirink teigiamus ir neigiamus žodžius bei frazes. Jūs iš esmės kuriate teigiamų ir neigiamų žodžių žodyną; bet, žinote, tai labai ribojo. Jei tai padarėte vietoje, kurioje buvo atliekamas automobilių remontas, o paskui turėjote kitą klientą, žinote, kas valė kilimus, tie du žodynai yra visiškai skirtingi. Jūs turite atlikti mašininį mokymąsi arba žmogaus prižiūrimą mokymąsi vėl ir vėl ir vėl. Taigi, „Excel“ naudoja šį dalyką, vadinamą MPQA subjektyvumo leksika, ir jūs galite tai naudoti „Google“. Jame yra informacija apie tai - 5 097 neigiami žodžiai, 2533 teigiami žodžiai. Taigi,jis puikiai tinka trumpiems sakiniams, „Tweets“ ar „Facebook“ įrašams. Tačiau pastebėjau vieną dalyką: jei kas nors rašo dvigubais neiginiais, aš negaliu pasakyti, kad aš nekenčiu šios funkcijos, na, mašininis mokymasis ten nepavyks. Ir po velnių, man nepavyksta. Negaliu pasakyti, ar jie laimingi, ar ne.

Gerai, todėl štai ką mes darome. „Excel 2013“ arba „Excel 2016“ eikite į skirtuką „Įterpti“, eikite į „Store“, kai pasirodys paieškos laukelis, ieškokite „Azure Machine“ ir ten gausite „Azure Machine Learning“. Spustelėkite Pridėti. Gerai, ir du skirtingi įrankiai čia: „Titaniko maitintojo prognozuotojas“, kuris yra įdomus; ir „Text Sentiment analysis Excel“ priedą. Panaudokime tą. Gerai, štai keli dalykai, kurie jus pakels. Jūsų antraštė: Paimkite pastraipą, kad paaiškintumėte savo atsakymą. Ji turi atitikti schemą, o schema sako, kad antraštėje turi būti „tweet_text“. Taigi, čia: „tweet_text“, žinoma, svarbūs atvejai, gerai. Tada uždarykite schemą, tada nuspėkite, Įvestis: nuo A1 iki 100, Mano duomenys turi antraštes, Išvestis: DataB1, Įtraukite antraštes. Jie duos mums 2 stulpelius.Įsitikinkite, kad turite 2 tuščius stulpelius; priešingu atveju tai pakeis duomenis. Turite 2 pasirinkimus: kelios eilutės vienu metu arba kaip paketas. Tai tik šimtas, todėl tai tikrai nesvarbu. Aš pasirinksiu „Predict“ ir „BAM“! Tiesiog taip greitai.

Gerai, dabar gauname 2 stulpelius: gerai, gauname sentimentą ir balą. Taigi, pateikime balus procentais su dešimtųjų tikslumu. Gerai, taigi 47,496, tai nuo 0 iki 100%. Beveik 100 yra labai teigiamas, arti 0 yra labai neigiamas, gerai? Taigi čia mes turime vieną, kur yra nedidelė problema, mane varo iš proto. Nerandate sprendimo, todėl galite suprasti, kodėl tai vertinama kaip itin neigiama. Pažvelkime į tą, kuris yra itin teigiamas. Gerai, kad žinotumėte, todėl čia turime keletą džiugių žodžių: prašau ir ačiū, šauktukai ir pan. Tai gali prisidėti prie aukšto rezultato. Gerai, taigi ar jis tobulas? Ne, bet tai suteiks jums greitą ir greitą būdą pasakyti, kiek žmonių yra labai patenkinti ar nepaprastai neigiami dėl šių atsakymų.

Ir, žinoma, vėlgi, čia mes galime tai padaryti naudodamiesi suvestine lentele: Įterpti, „Pivot Table“, čia pat pereiti į esamą darbalapį, spustelėkite Gerai, ir mus domina „Sentiment“, o tada galbūt su vidutiniu balu yra kiekvienas iš tų. Taigi mes pakeisime tai laukų nustatymuose kaip vidurkiai, spustelėkite Gerai. Ir taip, o gal net grafas. Spėju, kad norėtume pažinti grafą, kiek žmonių. Taigi imsimės kitos srities, taigi žinome, kiek žmonių buvo neigiami. Ooh, kiek žmonių buvo neutralių, kiek žmonių buvo teigiamų ir koks buvo vidutinis kiekvieno iš jų balas.

Gerai, taigi, jei turite apklausos duomenų ir tai yra keli pasirinkimai, lengva naudoti sukamą lentelę, kad sužinotumėte, kiek procentų turi kiekvienas atsakymas. Tačiau norint gauti laisvos formos teksto atsakymus sunku apdoroti. Jei jų turite šimtus ar tūkstančius, nuotaikų analizė yra mašininis metodas nuspėti, ar atsakymas yra teigiamas, ar neigiamas. „Microsoft“ tam siūlo nemokamą įrankį. Veikia „Excel 2013“ arba „Excel 2016“ pavadinimu „Azure Machine Learning“. Dažniausiai rankomis rankiniu būdu tenka patirti 5% teiginių kategoriją. Tai nėra lanksti, jūs turite perklasifikuoti kiekvieną naują duomenų rinkinį, tačiau „Excel“ naudoja šią MPQA subjektyvumo leksiką. Tai bendras žodynas. Tai veiks trumpiems sakiniams, „Tweets“, „Facebook“ įrašams. Galiu apsigauti dvigubais neiginiais. Taigi tiesiog eikite į „Excel“ parduotuvę,ieškokite „Azure Machine Learning“. Išvesties diapazonui nurodykite įvestį ir du stulpelius. Nepamirškite šiuo atveju pakeisti antraštės, kad ji atitiktų schemą, tweet_text.

Gerai, todėl eik. Kitą kartą, kai turėsite analizuoti didelį duomenų kiekį, patikrinkite naudodami nemokamą „Excel 2013“ priedą „Azure Machine Learning“. Dėkojame, kad užsukote, pamatysime kitą kartą, kai gausite kitą internetinę transliaciją iš.

Atsisiųsti failą

Atsisiųskite failo pavyzdį čia: Podcast2062.xlsm

Įdomios straipsniai...