Nomeando coisas

O que é isto? É uma etiqueta ou uma tag?

"O que é isto? Como se chama?”

Damos nomes às coisas para poder conhecê-las. A palavra taxonomia, por exemplo, veio dos verbos gregos: τασσεῖν ou tassein = "para classificar" e νόμος ou nomos = lei, ciência, administrar.

Por isso, podemos dizer que as classificações tentam dar nome para as coisas: um nome diferencia o que é nomeado das coisas com outros nomes, arranjando a diferenciação dos seus significados. Quando classificamos algo, não só criamos uma estrutura (uma organização) de um conhecimento, mas também damos um nome para este algo. Definimos, entre outras coisas, o que ele é, onde está e do que faz parte.

Vários nomes para a mesma coisa?

Nem sempre um só nome é o bastante, podemos colocar diversos nomes para descrever o mesmo objeto. É natural que tentamos dar mais de um nome para as mesmas coisas: Como se chama aquilo ali, são "tags" ou "etiquetas"? 

Não é certo dizer que uma mesma coisa recebe vários nomes. Cada nome diferente que uma coisa recebe, tem um significado diferente. Se peço "Quem é aquele?" haverá quem diga "É meu amigo", "meu mano", "meu brother", "meu chegado", meu "camarada", entre outros. A princípio, todos podem estar dizendo a mesma coisa, mas cada uma destas palavras permite significações diferentes, e até conflitantes. Por exempo: a pessoa a quem me referi é irmão (brother, mano) ou é um amigo da pessoa quem me respondeu? Uma simples resposta como "meu brother", que se refere a uma outra pessoa, também fala muito sobre a pessoa que utiliza esta expressão. Usar a palavra "brother" como sinônimo de "amigo" é uma espécie de gíria de pessoas de determinados grupos sociais específicos. Não são todos que utilizam esta expressão, e nem que a entendem.

Dar nome para tudo

Se tivermos várias coisas, então não teremos uma coisa só. Se só houvesse tudo (uma coisa só), não precisaríamos de taxonomia: não precisaríamos classificar nada. Como seria o nome para “tudo”? Seria “tudo”? E se tudo fosse a mesma coisa, ou seja, se tudo fosse exatamente igual, a mesma coisa?

Cada coisa com seu nome

As coisas não são iguais. Na verdade, são todas diferentes. Se todas são diferentes, todas deveriamo receber um nome, mas isso tornaria impossível para a maioria das pessoas (ou todas) lidar com a linguagem.

Se, numa biblioteca física, haviam alguns problemas (aonde colocar um único livro físico? na seção de ciências sociais, humanas, publicidade, jornalismo... algumas áreas se confundem) na internet (pelo menos) este problema acabou: um mesmo conteúdo pode estar em mais de um lugar e receber várias classificações ao mesmo tempo. Estas classificações costumam ser por etiquetas.

Comentários

Ontologia versus Senso-comum

Na Computação esse debate é recorrente, mas com outros termos. Para discriminar as coisas, os computadores precisam de categorias explícitas. Porém, eles não são bons em se comunicar conosco porque boa parte das categorias que nós seres humanos usamos para nos orientar, comunicar, interagir são implíticas, dependentes de uma relação tácita com o contexto social. 
A categoria animal numa aula de biologia é diferente da categoria animal em futebol, porém, existe uma relação entre elas. Quando a torcida começou a gritar que "Au au au o Edmundo é animal", certamente não estavam se referindo à categoria biológica, porém, estavam referenciando-a. Se não tivessem tido a experiência com a categoria biológica anteriormente, o sentido não seria o mesmo. 

É por isso que não se pode precisar o significado de um signo qualquer, pois ele não é único e nem dado. O significado do signo não está nele, nem tampouco num intérprete, mas sim na relação entre eles. O significado está no contexto (social).

Você está tentando resolver o problema da folcsonomia aprimorando sua capacidade de representação do mundo. Isso a computação tentou fazer através do conceito filosófico de Ontologia. A proposta é definir as categorias universais mais básicas e abrangentes, capazes de classificar tudo em seu esquema, sem exceções. Claro que isso logo se demonstrou impossível e então, passou-se a criar ontologias por áreas do conhecimento, reduzindo o escopo. A Web Semântica é uma das propostas mais humildes dos estudos ontológicos em Computação. 

Mesmo a Web Semântica o pessoal tá percebendo que é meio inviável, não porque as pessoas tenham preguiça de escolher em que categoria classificar os conteúdos da Web, mas porque isso seria extremamente difícil. Em que categoria colocar o Edmundo? Biologia ou Esportes? Parece coerente com o esquema colocar na categoria Esportes, porém, não é somente pela coerência que categorizamos as coisas. Quebramos a coerência justamente para dar sentidos outros. 

O máximo que um computador é capaz de fazer num esquema de classificação é a recursividade, enfim, perceber que esta classificação é uma classificação da classificação. O que ele não consegue perceber é que estamos dando um pulo do gato, estamos indo para outro sentido. Estamos fugindo da classificação sem necessariamente cair em outra. 

Nem tudo no mundo é classificável! O mundo é maior que nossas categorias. O bebê já nasce sabendo isso, mas o computador não. Claro, ele foi construído por quem não aprendeu (ou não se contentou) com isso. 

Os sistemas de classificação que tem tido mais sucesso hoje são aqueles que admitem essa posição humilde e tentam categorizar um conjunto infinito e impreciso de dados, sem o comprometimento de gerar um esquema absoluto.  

Um exemplo disso são as folcsonomias que, ao invés de contribuir para a emergência ou manutenção de um esquema, contribuem apenas para expandir horizontalmente o que se sabe sobre o mundo. 

Outro exemplo são as bases de senso-comum como a OpenMind do MIT. As pessoas cadastram idéias bem simples do tipo: "um carro serve para andar". "servir é ter utilidade". "andar é ir de um lugar ao outro". Aí o computador cruza estes dados e consegue obter algum significado sobre um novo texto dado. 

Outro projeto interessante inspirado no OpenMind é o OpenHeart que tenta amealhar dados sobre emoções. 

Sobre o OpenMind

Analisando o OpenMind, acho que dizer que "keys can open doors" (chaves podem abrir portas), um dicionário já nos diz. A inovação parece estar em tornar social a construção deste conhecimento, como um dicionário mutável de acordo com o senso comum. Talvez este sistema pudesse ficar mais interesse se pudessem ser adicionados EXEMPLOS e PROVAS: o PORQUE das afirmações afirmadas/incluídas: "Chaves podem abrir portas" porque portas tem fechaduras.

Então pode-se perguntar: "Fechaduras podem ser abertas por chaves?" e buscar o porque que "Fechaduras são abertas por chaves". Talvez esse exemplo acima seja simples, pois um esquema como "chaves podem abrir portas", "portas tem fechaduras" e "fechaduras são abertas por chaves" daria na mesma. Mas um relacionamento simples de que "chaves podem abrir portas" e "portas são abertas por chaves" já não explicaria tanto.

Raciocínio de senso-comum

É esse tipo de inferência que os algoritmos computacionais como o Divisi são capazes de fazer sem a necessidade de input. Porém, saber que "chaves abrem portas porque portas tem fechaduras" não torna o computador capaz de abrir uma porta. Ele sabe um pouco mais sobre estes objetos, mas não sabe como interagir com elas. 

Poderia se tentar cercar a ação de abrir uma porta pelo método de análise de senso-comum ("uma chave é um objeto pequeno de metal com dentes em ponta saliente", "a chave encaixa no buraco da fechadura", "a chave gira no buraco da fechadura e, com isso, abre o trico", "quando o trinco está aberto, a porta pode ser empurrada"), mas isso não o torna capaz de perceber que o trinco está ficando velho e é preciso forçar mais num sentido, que a porta emperrada basta empurrar com força e outros detalhes que nós sabemos mas nem nos damos conta.

O grande problema do computador é que ele só trabalha com conhecimento explícito e boa parte do que fazemos depende de conhecimento tácito.  

AVISO: Sobre as alterações neste post

Alterei totalmente este post. Dividi os muitos assuntos que aqui se encontravam em diversos textos menores, todos postados no projeto Etiquetas sem Limites. Todos estes textos publicados em novos posts foram retirados daqui, para que o conteúdo não ficasse duplicado.

Eu não queria apagar este post, pois teve boa visitação e os comentários feitos nele são muito relevantes. Então aproveitei o tema principal dele e deixei e desenvolvi melhor o assunto da "nomeação das coisas". Assim, mesmo como texto ficando bem diferente do que era anteormente, continuará fazendo sentido dentro do projetos aonde está inserido, preservando-se.

Ordem de posts

Assim fica mais organizado, porém o comentário perde a conexão com o conteúdo e perde-se também o registro cronológico do projeto. Não dá pra traçar como você chegou nas idéias mais recentes nem saber o que é novidade e o que é velho.

Uma boa prática de blogs é somente fazer correções sobre o texto ou adicionar trechos, com marcação de atualização, mas nunca alterar completamente o texto. Acho que quando você quer mudar algo vale à pena fazer um novo post e explicar que mudou de idéia sobre algo e principalmente porque mudou de idéia.

Você está editando textos de blog como textos de wiki. Estes sim devem ser sempre atualizados. 

Enviar comentário

Seu email não será publicado.
  • Códigos HTML permitidos: <table> <tr> <td> <tbody> <address> <iframe> <p> <br> <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd><img><h2><h3><h4><h5><h6><object><param><embed><b><i><sup><sub><strike><hr><blockquote>
  • Youtube and google video links are automatically converted into embedded videos.
  • Endereços de páginas de internet e emails viram links automaticamente.
  • Endereços de email serão protegidos (ofuscados) de robôs que coletam endereços.

Mais informações sobre opções de formatação

CAPTCHA
Pergunta para verificar que você não é um robô de spam.
Essa pergunta é para verificar que você NÃO É um robô spammer.