Classification of Jalapão Tourist Comments in the Domains of Experience Based on Artificial Intelligence

Authors

DOI:

https://doi.org/10.11606/issn.1984-4867.v36pe025002

Keywords:

experience tourism, social networks, artificial intelligence, virtual community

Abstract

Tourism is an essential activity for people’s well-being and for the economy surrounding touristic areas. When one is interested in improving and developing touristic activities, analyzing tourist experiences may provide useful insights. One way to understand tourist experiences is by collecting their comments on social media. This kind of analysis is made by interpreting people’s comments and classifying their experience as being related to entertainment, education/learning, evasion/escapism, or aesthetics/contemplation. These categories are called experience domains. This paper presents a solution for automatically classifying touristic comments in experience domains by using artificial intelligence (AI). To conduct the study, we applied a database with tourists’ comments about the Jalapão State Park (Parque Estadual do Jalapão, Brazil) that had been manually classified in experience domains. We tested different AI techniques, i.e., Gaussian Naive Bayes, Support Vector Machine (SVM), and LSTM, and demonstrated that the automatic analysis of comments is feasible. Our research method comprised five steps: 1) data preparation, 2) dataset partition, 3) training, 4) hyperparameters adjustment, and 5) prediction. Our results show that IA techniques present different performances, depending on how we prepare and partition data. The best results were obtained with SVM technique, with an 88% F1 Score.

Downloads

Download data is not yet available.

Author Biographies

  • Jhonathan de Souza Lima, Universidade Federal do Paraná

    Especialista em Inteligência Artificial e Gestão de Projetos, Bacharel em Engenharia Elétrica, experiência em pesquisa e desenvolvimento de produtos eletrônicos.

  • João Eugenio Marynowski, Universidade Federal do Paraná

    Doutor, Mestre e Bacharel em Ciência da Computação, Professor e Pesquisador do Setor de Educação Profissional e Tecnológica da Universidade Federal do Paraná (UFPR).

  • Jose Elmar Feger, Universidade Federal do Paraná

    Doutor em Desenvolvimento Regional, Bacharel em Administração, Professor e Pesquisador do Programa de Pós-graduação em Turismo da Universidade Federal do Paraná (UFPR).

  • Rafaela Mantovani Fontana, Universidade Federal do Paraná

    Doutora em Informática, Professora Titular no Setor de Educação Profissional e Tecnológica da Universidade Federal do Paraná (UFPR).

References

Alencar, D. G., Santos, M. L. dos, Souza, A. A. e, & Gândara, J. M. G. (2019). Produtos turísticos para demandantes de experiências da dimensão entretenimento de Pine & Gilmore: novas características e tendências para o Paraná. Turismo Visão e Ação, 21(2), 46. https://doi.org/10.14210/rtva.v21n2.p46-67

Añaña, E. da S., Anjos, F. A. dos, & Pereira, M. de L. (2016). Imagem de destinos turísticos: avaliação à luz da teoria da experiência na economia baseada em serviços. Revista Brasileira de Pesquisa Em Turismo, 10(2). https://doi.org/10.7784/rbtur.v10i2.1093

Bandeira, L. C. L., Menezes, P. D. L. (2022) A Experiência dos Hóspedes na Hotelaria de João Pessoa: uma análise a partir do conteúdo gerado no website Booking.com. Revista Turismo em Análise – RTA. V. 33, n 1, p. 191-212, jan-abr. DOI: http://dx.doi.org/10.11606/issn.1984-4867

Barbosa, J. L. N. et al. (2017). Introdução ao Processamento de Linguagem Natural usando Python. III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos. v. 1. n. 1. pp. 336-360.

Bardin, Laurence. Análise de Conteúdo.Tradução de Luís Antero Reta e Augusto Pinheiro. Edições 70 ano 1977.

Barreto, J. J., & Martínez, S. C. (2016). Marketing Experiencial en FITUR: Análisis de dos destinos competidores, Islas Canarias e Islas Baleares. PASOS Revista de Turismo y Patrimonio Cultural, 14(1), 75–91. https://doi.org/10.25145/j.pasos.2016.14.005

Benetti, A. C., Carrión Carracedo Ozelame, Â. M., Acosta Pereira, L., & Torres Tricárico, L. (2018). Turismo de Experiência em Áreas Patrimoniais: Uma Análise das Emoções a Partir dos Comentários do TripAdvisor sobre a Estrada Parque Transpantaneira‑MT‑Brasil. PASOS. Revista de Turismo y Patrimonio Cultural, 18(3), 565–581. https://doi.org/10.25145/j.pasos.2018.16.042

Beni, M. C. (2004). Turismo: da economia de serviços a economia da experiência. Revista Turismo - Visão e Ação. pp. 296-306.

Bernardo A. et al. (2020). C-SMOTE: Continuous Synthetic Minority Oversampling for Evolving Data Streams. Politecnico di Milano. Dipartimento di Elettronica Informazione e Bioingegneria.

Boaria, F., & dos Santos, C. A. F. (2018). Análise do impacto do conteúdo gerado pelos usuários nas mídias sociais e agências de viagens online na gestão hoteleira. Marketing & Tourism Review, 3 (3), ND. DOI: https://doi.org/10.29149/mtr.v3i3.4594

Brasil (2010). Ecoturismo: orientações básicas (2a ed.) Brasília: Ministério do Turismo. Acessado em 01 de agosto de 2022. Recuperado de https://bit.ly/3rcgRjO

Brussolo, Fábio. As Diretrizes Curriculares dos Cursos de graduação em Ciência Contábeis X o Mercado de Trabalho através das Ofertas de Emprego para a Área Contábil na grande São Paulo: Uma Análise crítica. São Paulo 2007

Caracristi, M. de F. de A., Feger, J. E., Silva, T. M. da, & Marynowski, J. E. (2021). Uma Viagem pelo Jalapão, Brasil: análise das experiências turísticas. Revista Paranaense de Desenvolvimento (RPD), 41(138), 89–110.

Chawla, N. V. (2002) SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research .16(1). pp. 321-357.

Goldschmidt, R., Bezerra, E., Passos, E. (2015). Data Mining: Conceitos, Técnicas, Algoritmos, Orientações e Aplicações. In Northern Ontario Business: Vol. 2. ed. Elsevier.

Croft, W. B., Metzler, D., Strohman, T. (2010). Search Engines: Information Retrieval in Practice. vol. 283. Addison-Wesley, Reading.

Gándara, J. M. G., Brea, J. A. F., & Manosso, F. C. (2013). Calidad de da experiencia en los Hoteles Termales de Galicia, España Un análisis a través de la reputación online. Estudios y Perspectivas En Turismo, 22(3).

Gurinder, S. et al. (2019). Comparison between Multinomial and Bernoulli Näıve Bayes for Text Classification. Amity University. International Conference on Automation, Computational and Technology Management (ICACTM).

Gonçalvez, Tayná Costa et al. Técnicas de mineração de dados: um estudo de caso da evasão no ensino superior do Instituto Federal do Maranhão. Revista Brasileira de Computação Aplicada, Novembro 2018.

Gosling, M. de S., Silva, J. A., Mendes, J., Coelho, M. de F., & Brener, I. (2016). Experiência turística em museus: percepções de gestores e visitantes. Tourism & Management Studies, 12(2), 107–116. https://doi.org/10.18089/tms.2016.12212

Guissoni, R., Alencar, D. G., & Gândara, J. M. (2019). Experience tourism in Paraná-Brazil: An analysis of tourists looking for business, urban and sports experiences. Journal of Tourism and Development, 32.

Heimerl, F., Gleicher, M. (2018). Interactive Analysis of Word Vector Embeddings. Computer Graphics Forum. 37(3). pp. 253–265. DOI: https://doi.org/10.1111/cgf.13417

Hochreiter, S., Schmidhuber, J. (1997). Long Short-Term Memory. Neural Comput. vol. 9. no. 8. pp. 1735–1780.

Hyland, K. (2008). As can be seen: lexical bundles and disciplinary variation. English for Specific Purposes. London: Elsevier. vol. 27.

Jang, B. et al. (2020). Bi-LSTM Model to Increase Accuracy in Text Classification: Combining Word2vec CNN and Attention Mechanism. Applied Sciences.

Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. Cornell University.

Kaizer, E. F. ;, Caracristi, M. F. A. ;, Feger, J. E. ;, Marynowski, J. E. ;, & Silva, T. M. (2021). Análise da experiência relatada pelos turistas ao visitar o Parque Estadual do Jalapão (PEJ) – TO, Brasil. Ateliê Do Turismo, 5(1), 183–204.

Kennedy, O. et al. (2015). N-gram Based Text Categorization Method for Improved Data Mining. Journal of Information Engineering and Applications. Vol.5. No.8.

Köksal, O. (2022). A Comparative Text Classification Study with Deep Learning-Based Algorithms, Artificial Intelligence and Information Technologies Department ASELSAN. 9th International Conference on Electrical and Electronics Engineering.

Law, R.,Buhalis, D., & Cobanoglu, C. (2014),”Progress on information and communication technologies in hospitality and tourism”, International Journal of Contemporary Hospitality Management, Vol.26.

Loureiro, S. M. C. (2014). The role of the rural tourism experience economy in place attachment and behavioral intentions. International Journal of Hospitality Management, 40. https://doi.org/10.1016/j.ijhm.2014.02.010

Machado, Aydano P. et al. MINERAÇÃO DE TEXTO EM REDES SOCIAIS APLICADA À EDUCAÇÃO A DISTÂNCIA. Revista Digital da CVA - Ricesu, ISSN 1519-8529 Volume 6, Número 23, Julho de 2010.

Mateiro, B. M. de J. (2018). O contributo da experiência turística para o desenvolvimento do turismo nos destinos rurais: uma revisão da literatura. Pasos. Revista de Turismo y Patrimonio Cultural, 16(4), 939–956. https://doi.org/10.25145/j.pasos.2018.16.066

Mondo, T. S., Talini, M. C., & Fiates, G. G. S. (2016). A qualidade de serviços em atrativos turísticos de Florianópolis à luz da teoria do turismo de experiência. Revista de Turismo Contemporâneo, 4(2). https://doi.org/10.21680/2357-8211.2016v4n2ID8302

Morais, E. A. M., & Ambrósio, A. P. L. (2007). Mineração de Textos.

Mossberg, L. (2007). A Marketing Approach to the Tourist Experience. Scandinavian Journal of Hospitality and Tourism, 7(1), 59–74. https://doi.org/10.1080/15022250701231915

Mullen, L. A. et al. (2018). Fast, Consistent Tokenization of Natural Language Text. The Journal of Open Source Software.

Ogada, K., Mwangi, W., & Cheruiyot, W. (2015). N-gram Based Text Categorization Method for Improved Data Mining. Journal of Information Engineering and Applications, 5(8), 35–43. www.iiste.org

Pezzi, E., & Vianna, S. L. G. (2015). A Experiência Turística e o Turismo de Experiência: um estudo sobre as dimensões da experiência memorável. Revista Turismo Em Análise, 26(1), 165–187. https://doi.org/10.11606/issn.1984-4867.v26i1p165-187

Pine, B. J., & Gilmore, J. H. (1998). Welcome to the experience economy. Harvard Business Review, 76(4).

Pine, B. J., Gilmore, J. H. (1999). The experience economy: work is a theatre & every business a stage. Boston: Harvard Business School.

Rahman, Md. H. et al. (2018). An Investigation and Evaluation of N-Gram, TF-IDF and Ensemble Methods in Sentiment Classification. Second International Conference. ICACDS 2018. Dehradun, India, April 20-21.

Rina Doran, Shlomo Marco, Syllabus Evaluation by the Job-analysis Technique. European Journal of Engineering Education, Vol. 24, No.2, 1999.

Santos, M. L., Alencar, D. G., Andrade e Souza, A., & Gândara, J. M. G. (2018). Tendências do consumidor em turismo: a oferta no Paraná (Brasil) para demandantes de experiências. Investigaciones Turísticas, 16, 143. https://doi.org/10.14198/INTURI2018.16.08

Silva, E. M. C., & Trentin, F. (2019). Turismo de Experiência: L ‘Arte Ceccato Vila Flores. Caderno Virtual de Turismo, 18(3). https://doi.org/10.18472/cvt.18n3.2018.1351

Singh, G., Kumar, B., Gaur, L., & Tyagi, A. (2019). Comparison between Multinomial and Bernoulli Naïve Bayes for Text Classification. ICACTM - International Conference on Automation, Computational and Technology Management, 593–596. https://doi.org/10.1109/ICACTM.2019.8776800

Tocantins, G. U. C. (2022) Parque Estadual do Jalapão. Tocantins. Acessado em 06 de agosto de 2022. Recuperado de http://gesto.to.gov.br/uc/45/

Torre, O. De La (1992). El turismo fenomeno social. México: Fondo de Cultura Económica.

TripAdvisor (2022). TripAdvisor: mais de um bilhão de avaliacões de hotéis, atrações, restaurantes e muito mais, Acessado em 06 de agosto de 2022. Recuperado de https://www.tripadvisor.com.br/

Venkatesh, Ranjitha, K. V. (2018). Classification and Optimization Scheme for Text Data using Machine Learning Naïve Bayes Classifier. University Visvesvaraya. College of Engineering. World Symposium on Communication Engineering.

Violos, J., Tserpes, K., Varlamis, I., & Varvarigou, T. (2018). Text Classification Using the N-Gram Graph Representation Model Over High Frequency Data Streams. Frontiers in Applied Mathematics and Statistics, 4. https://doi.org/10.3389/fams.2018.00041

Yadav, S., Shukla, S. (2016). Analysis of k-fold cross-validation over holdout validation on colossal datasets for quality classification. IEEE 6th International Conference on Advanced Computing.

Yang, L., Shami, A. (2020). On Hyperparameter Optimization of Machine Learning Algorithms: Theory and Practice. Department of Electrical and Computer Engineering. University of Western Ontario.

Yang, X. (2022). A Study of Text Vectorization Method Combining Topic Model and Transfer Learning. School of Information. Beijing Wuzi University. Beijing, China.

Ying, X. (2019). An Overview of Overfitting and its Solutions. Journal of Physics. Conference Series.

Ying, Y. (2021). Effectiveness of the News Text Classification Test Using the Naïve Bayes Classification Text Mining Method. Journal of Physics: Conference Series.

Published

2025-08-08

How to Cite

LIMA, Jhonathan de Souza; MARYNOWSKI, João Eugenio; FEGER, Jose Elmar; FONTANA, Rafaela Mantovani. Classification of Jalapão Tourist Comments in the Domains of Experience Based on Artificial Intelligence. Revista Turismo em Análise, São Paulo, Brasil, v. 36, p. e025002, 2025. DOI: 10.11606/issn.1984-4867.v36pe025002. Disponível em: https://revistas.usp.br/rta/article/view/220516.. Acesso em: 3 jan. 2026.