Classification of Jalapão Tourist Comments in the Domains of Experience Based on Artificial Intelligence
DOI:
https://doi.org/10.11606/issn.1984-4867.v36pe025002Keywords:
experience tourism, social networks, artificial intelligence, virtual communityAbstract
Tourism is an essential activity for people’s well-being and for the economy surrounding touristic areas. When one is interested in improving and developing touristic activities, analyzing tourist experiences may provide useful insights. One way to understand tourist experiences is by collecting their comments on social media. This kind of analysis is made by interpreting people’s comments and classifying their experience as being related to entertainment, education/learning, evasion/escapism, or aesthetics/contemplation. These categories are called experience domains. This paper presents a solution for automatically classifying touristic comments in experience domains by using artificial intelligence (AI). To conduct the study, we applied a database with tourists’ comments about the Jalapão State Park (Parque Estadual do Jalapão, Brazil) that had been manually classified in experience domains. We tested different AI techniques, i.e., Gaussian Naive Bayes, Support Vector Machine (SVM), and LSTM, and demonstrated that the automatic analysis of comments is feasible. Our research method comprised five steps: 1) data preparation, 2) dataset partition, 3) training, 4) hyperparameters adjustment, and 5) prediction. Our results show that IA techniques present different performances, depending on how we prepare and partition data. The best results were obtained with SVM technique, with an 88% F1 Score.
Downloads
References
Alencar, D. G., Santos, M. L. dos, Souza, A. A. e, & Gândara, J. M. G. (2019). Produtos turísticos para demandantes de experiências da dimensão entretenimento de Pine & Gilmore: novas características e tendências para o Paraná. Turismo Visão e Ação, 21(2), 46. https://doi.org/10.14210/rtva.v21n2.p46-67
Añaña, E. da S., Anjos, F. A. dos, & Pereira, M. de L. (2016). Imagem de destinos turísticos: avaliação à luz da teoria da experiência na economia baseada em serviços. Revista Brasileira de Pesquisa Em Turismo, 10(2). https://doi.org/10.7784/rbtur.v10i2.1093
Bandeira, L. C. L., Menezes, P. D. L. (2022) A Experiência dos Hóspedes na Hotelaria de João Pessoa: uma análise a partir do conteúdo gerado no website Booking.com. Revista Turismo em Análise – RTA. V. 33, n 1, p. 191-212, jan-abr. DOI: http://dx.doi.org/10.11606/issn.1984-4867
Barbosa, J. L. N. et al. (2017). Introdução ao Processamento de Linguagem Natural usando Python. III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos. v. 1. n. 1. pp. 336-360.
Bardin, Laurence. Análise de Conteúdo.Tradução de Luís Antero Reta e Augusto Pinheiro. Edições 70 ano 1977.
Barreto, J. J., & Martínez, S. C. (2016). Marketing Experiencial en FITUR: Análisis de dos destinos competidores, Islas Canarias e Islas Baleares. PASOS Revista de Turismo y Patrimonio Cultural, 14(1), 75–91. https://doi.org/10.25145/j.pasos.2016.14.005
Benetti, A. C., Carrión Carracedo Ozelame, Â. M., Acosta Pereira, L., & Torres Tricárico, L. (2018). Turismo de Experiência em Áreas Patrimoniais: Uma Análise das Emoções a Partir dos Comentários do TripAdvisor sobre a Estrada Parque Transpantaneira‑MT‑Brasil. PASOS. Revista de Turismo y Patrimonio Cultural, 18(3), 565–581. https://doi.org/10.25145/j.pasos.2018.16.042
Beni, M. C. (2004). Turismo: da economia de serviços a economia da experiência. Revista Turismo - Visão e Ação. pp. 296-306.
Bernardo A. et al. (2020). C-SMOTE: Continuous Synthetic Minority Oversampling for Evolving Data Streams. Politecnico di Milano. Dipartimento di Elettronica Informazione e Bioingegneria.
Boaria, F., & dos Santos, C. A. F. (2018). Análise do impacto do conteúdo gerado pelos usuários nas mídias sociais e agências de viagens online na gestão hoteleira. Marketing & Tourism Review, 3 (3), ND. DOI: https://doi.org/10.29149/mtr.v3i3.4594
Brasil (2010). Ecoturismo: orientações básicas (2a ed.) Brasília: Ministério do Turismo. Acessado em 01 de agosto de 2022. Recuperado de https://bit.ly/3rcgRjO
Brussolo, Fábio. As Diretrizes Curriculares dos Cursos de graduação em Ciência Contábeis X o Mercado de Trabalho através das Ofertas de Emprego para a Área Contábil na grande São Paulo: Uma Análise crítica. São Paulo 2007
Caracristi, M. de F. de A., Feger, J. E., Silva, T. M. da, & Marynowski, J. E. (2021). Uma Viagem pelo Jalapão, Brasil: análise das experiências turísticas. Revista Paranaense de Desenvolvimento (RPD), 41(138), 89–110.
Chawla, N. V. (2002) SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research .16(1). pp. 321-357.
Goldschmidt, R., Bezerra, E., Passos, E. (2015). Data Mining: Conceitos, Técnicas, Algoritmos, Orientações e Aplicações. In Northern Ontario Business: Vol. 2. ed. Elsevier.
Croft, W. B., Metzler, D., Strohman, T. (2010). Search Engines: Information Retrieval in Practice. vol. 283. Addison-Wesley, Reading.
Gándara, J. M. G., Brea, J. A. F., & Manosso, F. C. (2013). Calidad de da experiencia en los Hoteles Termales de Galicia, España Un análisis a través de la reputación online. Estudios y Perspectivas En Turismo, 22(3).
Gurinder, S. et al. (2019). Comparison between Multinomial and Bernoulli Näıve Bayes for Text Classification. Amity University. International Conference on Automation, Computational and Technology Management (ICACTM).
Gonçalvez, Tayná Costa et al. Técnicas de mineração de dados: um estudo de caso da evasão no ensino superior do Instituto Federal do Maranhão. Revista Brasileira de Computação Aplicada, Novembro 2018.
Gosling, M. de S., Silva, J. A., Mendes, J., Coelho, M. de F., & Brener, I. (2016). Experiência turística em museus: percepções de gestores e visitantes. Tourism & Management Studies, 12(2), 107–116. https://doi.org/10.18089/tms.2016.12212
Guissoni, R., Alencar, D. G., & Gândara, J. M. (2019). Experience tourism in Paraná-Brazil: An analysis of tourists looking for business, urban and sports experiences. Journal of Tourism and Development, 32.
Heimerl, F., Gleicher, M. (2018). Interactive Analysis of Word Vector Embeddings. Computer Graphics Forum. 37(3). pp. 253–265. DOI: https://doi.org/10.1111/cgf.13417
Hochreiter, S., Schmidhuber, J. (1997). Long Short-Term Memory. Neural Comput. vol. 9. no. 8. pp. 1735–1780.
Hyland, K. (2008). As can be seen: lexical bundles and disciplinary variation. English for Specific Purposes. London: Elsevier. vol. 27.
Jang, B. et al. (2020). Bi-LSTM Model to Increase Accuracy in Text Classification: Combining Word2vec CNN and Attention Mechanism. Applied Sciences.
Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. Cornell University.
Kaizer, E. F. ;, Caracristi, M. F. A. ;, Feger, J. E. ;, Marynowski, J. E. ;, & Silva, T. M. (2021). Análise da experiência relatada pelos turistas ao visitar o Parque Estadual do Jalapão (PEJ) – TO, Brasil. Ateliê Do Turismo, 5(1), 183–204.
Kennedy, O. et al. (2015). N-gram Based Text Categorization Method for Improved Data Mining. Journal of Information Engineering and Applications. Vol.5. No.8.
Köksal, O. (2022). A Comparative Text Classification Study with Deep Learning-Based Algorithms, Artificial Intelligence and Information Technologies Department ASELSAN. 9th International Conference on Electrical and Electronics Engineering.
Law, R.,Buhalis, D., & Cobanoglu, C. (2014),”Progress on information and communication technologies in hospitality and tourism”, International Journal of Contemporary Hospitality Management, Vol.26.
Loureiro, S. M. C. (2014). The role of the rural tourism experience economy in place attachment and behavioral intentions. International Journal of Hospitality Management, 40. https://doi.org/10.1016/j.ijhm.2014.02.010
Machado, Aydano P. et al. MINERAÇÃO DE TEXTO EM REDES SOCIAIS APLICADA À EDUCAÇÃO A DISTÂNCIA. Revista Digital da CVA - Ricesu, ISSN 1519-8529 Volume 6, Número 23, Julho de 2010.
Mateiro, B. M. de J. (2018). O contributo da experiência turística para o desenvolvimento do turismo nos destinos rurais: uma revisão da literatura. Pasos. Revista de Turismo y Patrimonio Cultural, 16(4), 939–956. https://doi.org/10.25145/j.pasos.2018.16.066
Mondo, T. S., Talini, M. C., & Fiates, G. G. S. (2016). A qualidade de serviços em atrativos turísticos de Florianópolis à luz da teoria do turismo de experiência. Revista de Turismo Contemporâneo, 4(2). https://doi.org/10.21680/2357-8211.2016v4n2ID8302
Morais, E. A. M., & Ambrósio, A. P. L. (2007). Mineração de Textos.
Mossberg, L. (2007). A Marketing Approach to the Tourist Experience. Scandinavian Journal of Hospitality and Tourism, 7(1), 59–74. https://doi.org/10.1080/15022250701231915
Mullen, L. A. et al. (2018). Fast, Consistent Tokenization of Natural Language Text. The Journal of Open Source Software.
Ogada, K., Mwangi, W., & Cheruiyot, W. (2015). N-gram Based Text Categorization Method for Improved Data Mining. Journal of Information Engineering and Applications, 5(8), 35–43. www.iiste.org
Pezzi, E., & Vianna, S. L. G. (2015). A Experiência Turística e o Turismo de Experiência: um estudo sobre as dimensões da experiência memorável. Revista Turismo Em Análise, 26(1), 165–187. https://doi.org/10.11606/issn.1984-4867.v26i1p165-187
Pine, B. J., & Gilmore, J. H. (1998). Welcome to the experience economy. Harvard Business Review, 76(4).
Pine, B. J., Gilmore, J. H. (1999). The experience economy: work is a theatre & every business a stage. Boston: Harvard Business School.
Rahman, Md. H. et al. (2018). An Investigation and Evaluation of N-Gram, TF-IDF and Ensemble Methods in Sentiment Classification. Second International Conference. ICACDS 2018. Dehradun, India, April 20-21.
Rina Doran, Shlomo Marco, Syllabus Evaluation by the Job-analysis Technique. European Journal of Engineering Education, Vol. 24, No.2, 1999.
Santos, M. L., Alencar, D. G., Andrade e Souza, A., & Gândara, J. M. G. (2018). Tendências do consumidor em turismo: a oferta no Paraná (Brasil) para demandantes de experiências. Investigaciones Turísticas, 16, 143. https://doi.org/10.14198/INTURI2018.16.08
Silva, E. M. C., & Trentin, F. (2019). Turismo de Experiência: L ‘Arte Ceccato Vila Flores. Caderno Virtual de Turismo, 18(3). https://doi.org/10.18472/cvt.18n3.2018.1351
Singh, G., Kumar, B., Gaur, L., & Tyagi, A. (2019). Comparison between Multinomial and Bernoulli Naïve Bayes for Text Classification. ICACTM - International Conference on Automation, Computational and Technology Management, 593–596. https://doi.org/10.1109/ICACTM.2019.8776800
Tocantins, G. U. C. (2022) Parque Estadual do Jalapão. Tocantins. Acessado em 06 de agosto de 2022. Recuperado de http://gesto.to.gov.br/uc/45/
Torre, O. De La (1992). El turismo fenomeno social. México: Fondo de Cultura Económica.
TripAdvisor (2022). TripAdvisor: mais de um bilhão de avaliacões de hotéis, atrações, restaurantes e muito mais, Acessado em 06 de agosto de 2022. Recuperado de https://www.tripadvisor.com.br/
Venkatesh, Ranjitha, K. V. (2018). Classification and Optimization Scheme for Text Data using Machine Learning Naïve Bayes Classifier. University Visvesvaraya. College of Engineering. World Symposium on Communication Engineering.
Violos, J., Tserpes, K., Varlamis, I., & Varvarigou, T. (2018). Text Classification Using the N-Gram Graph Representation Model Over High Frequency Data Streams. Frontiers in Applied Mathematics and Statistics, 4. https://doi.org/10.3389/fams.2018.00041
Yadav, S., Shukla, S. (2016). Analysis of k-fold cross-validation over holdout validation on colossal datasets for quality classification. IEEE 6th International Conference on Advanced Computing.
Yang, L., Shami, A. (2020). On Hyperparameter Optimization of Machine Learning Algorithms: Theory and Practice. Department of Electrical and Computer Engineering. University of Western Ontario.
Yang, X. (2022). A Study of Text Vectorization Method Combining Topic Model and Transfer Learning. School of Information. Beijing Wuzi University. Beijing, China.
Ying, X. (2019). An Overview of Overfitting and its Solutions. Journal of Physics. Conference Series.
Ying, Y. (2021). Effectiveness of the News Text Classification Test Using the Naïve Bayes Classification Text Mining Method. Journal of Physics: Conference Series.
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Jhonathan de Souza Lima, João Eugenio Marynowski, Jose Elmar Feger, Rafaela Mantovani Fontana

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Authors retain the copyright and grant the journal the right of first publication, with the work simultaneously licensed under the Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0), allowing the sharing of the work with recognition of its authorship and initial publication in RTA.







