Intentando catalogar emojis y emoticonos, está la cuestión de cómo seleccionarlos; un paper daba una pista interesante: los emojis son mas frecuentes al final de un texto o pasada la primera palabra, en twitter. Asi que se me ocurre, veamos cuales son las ultimas palabras mas frecuentes en los tuits en castellano, y de paso tambien cuales son las primeras mas frecuentes en las respuestas, esto es, despues de las arrobas «at» que indican conversacion. En este caso no hay tanta probabilidad de obtener un emoticono… Salen algunos, pero lo principal es el jajaja y el gracias. Eso esta bien; seguimos siendo gente educada incluso en twitter.
Conv No_Conv no Me que No y Que yo El te La me Y si A es Si ya En a Nuevos No Ya Gracias Yo la Mi el Hoy jajaja Se lo Lo gracias Los por Como pero Cuando en Es jajajaja Por
Salen por supuesto ? 🙁 ? <3 🙂 xD ? 3 ? ? :v? (+) ??? ? ? ? xd, flechas y los tipicos lol, wtf, xp y demas reacciones. Pero es para las palabras finales donde hay otro cantar; haya o no conversacion, los finales mas frecuentes abundan en emotis y emojis
FamousFinalWords
Tweets de Conversacion | Tweets sin @ inicial. |
---|---|
jajaja | … |
? | … |
jaja | – |
xD | . |
? | ? |
🙁 | ? |
🙂 | ! |
jajajaja | |
??? | perfil |
?? | horas |
! | | |
. | 🙁 |
<3 | jajaja |
? | 🙂 |
amo | ? |
+ | jaja |
? | ?? |
no | ? |
😉 | by |
? | <3 |
jajajajaja | ? |
? | ??? |
si | ? |
XD | ? |
? | vida |
xd | ? |
!! | !! |
gracias | jajajaja |
:v | ? |
😀 | ? |
ahre | !!! |
no? | en |
!!! | 2016 |
… | ) |
nada | todo |
(?) | nada |
???? | ? |
bien | ? |
vos | via |
:3 | xD |
? | photo |
eso | vida. |
> | ? |
? | ? |
? | de… |
? | mierda |
Jajaja | bien |
yo | : |
jajaj | no |
?? | NEW |
? | .. |
? | (): |
amor | amo |
? | más |
jajajaj | mal |
? | 😀 |
(? | ?? |
todo | xd |
Jajajaja | :3 |
jajajajajaja | 😉 |
? | ahre |
vida | yo |
mas | ? |
más | ? |
mejor | ? |
mal | ?? |
favor | ? |
hola | ???? |
mucho | madre |
? | hoy |
quiero | mas |
?? | ??? |
Gracias | ? |
» | si |
ya | dormir |
:c | ? |
?? | mundo |
? | esto |
claro | agora |
igual | casa |
? | jajajajaja |
??? | :v |
? | ? |
JAJAJAJA | ? |
?? | nada. |
amigo | * |
siempre | eso |
ah | todo. |
? | ? |
saludos | día |
bueno | |
Jaja | siempre |
:/ | hora |
? | amor |
JAJAJA | 2 |
? | ? |
.. | mi |
😛 | (?) |
verdad | ? |
? | ya |
? | mañana |
????? | más. |
mierda | ????? |
amiga | ? |
eh | -.- |
ok | mejor |
no. | así |
Saludos | años |
hermosa | Venezuela |
? | no? |
ti | 1 |
en | ? |
también | ? |
mi | ? |
^^ | () |
jeje | bien. |
esto | loco |
día | la… |
es | > |
? | :c |
Es interesante que no hay muchos emoticonos alfabeticos, tan solo xp, XD y xc, a lo que se me alcanza. Hay algunos con mezcla de numeros y letras: X33333, 7o7. Pero parece que en general intentan separarse de las palabras.
cat BodyEspLang.sorted.uniq | grep "^@" | sed "s/[ ]*http[^ ]*//g" | sed "s/[@#][a-zA-Z0-9_]*[ ]*//g" | grep -o -P "^[^ \n\t]*" | LC_COLLATE=C sort -S30% -T tmp | LC_COLLATE=C uniq -c | sort -nr > FirstwordTalkEs.txt
cat ... | grep -o -P "[^ \n\t]*$" | ... > lastwordTalkEs.txt cat ...| grep -v "^@" |
Deja una respuesta