-**get_glove_embeddings.bash**: *script* que descarga el conjunto de de vectores de palabras computado con GloVe utilizado.
-**get_glove_embeddings.bash**: *script* que descarga el conjunto de de vectores de palabras computado con GloVe utilizado.
-**word2vec/get_word2vec_embeddings.bash**: *script* que descarga el conjunto de de vectores de palabras computado con Word2Vec utilizado.
-**word2vec/get_word2vec_embeddings.bash**: *script* que descarga el conjunto de de vectores de palabras computado con Word2Vec utilizado.
-**frequencies.tsv**
-**frequencies.tsv**
-**.gitignore**
-**.gitignore**
-**LICENSE**
-**LICENSE**
-**SENTEVAL_LICENSE**: licencia del toolkit [SentEval](https://github.com/facebookresearch/SentEval) desarollado por Facebook.
-**SENTEVAL_LICENSE**: licencia del toolkit [SentEval](https://github.com/facebookresearch/SentEval) desarollado por Facebook.
-**evaluation.ipynb**: fichero de Jupyter Notebook en el que se desarrolla la evaluación realizada.
-**evaluation.ipynb**: fichero de Jupyter Notebook en el que se desarrolla la evaluación realizada.
-**load.py**: contiene un conjunto de funciones para cargar y preprocesar los diferentes conjuntos de datos utilizados. El código está basado en el que se puede encontrar en el toolkit [SentEval](https://github.com/facebookresearch/SentEval).
-**load.py**: contiene un conjunto de funciones para cargar y preprocesar los diferentes conjuntos de datos utilizados. El código está basado en el que se puede encontrar en el toolkit [SentEval](https://github.com/facebookresearch/SentEval).
-**methods.py**: contiene las funciones que implementan los tres métodos evaluados para calcular la similiridad semántica entre dos pares de oraciones: media (average), *Smooth Inverse Frequency* (SIF), y *Word Mover's distance*.
-**methods.py**: contiene las funciones que implementan los tres métodos evaluados para calcular la similiridad semántica entre dos pares de oraciones: media (average), *Smooth Inverse Frequency* (SIF), y *Word Mover's distance*.
-**utils.py**: contiene algunas funciones de utilidad como para preprocesar las oraciones y evaluar los resultados de los diferentes métodos.
-**utils.py**: contiene algunas funciones de utilidad como para preprocesar las oraciones y evaluar los resultados de los diferentes métodos.
...
@@ -29,21 +37,27 @@
...
@@ -29,21 +37,27 @@
-**data/**
-**data/**
-**datatsets/**
-**datatsets/**
-**get_datasets.bash**: * script *that allows downloading the data sets used in the evaluation and which is a modification of the one present in the [SentEval] toolkit (https://github.com/facebookresearch/SentEval).
-**get_datasets.bash**: script that downloads the data sets used in the evaluation and which is a modification of the one present in the [SentEval](https://github.com/facebookresearch/SentEval) toolkit .
-**tokenizer.vec**
-**tokenizer.vec**
-**embedding/**
-**embedding/**
-**fasttext/get_fasttext_embeddings.bash**: * script *that downloads the set of word vectors computed with the FastText used.
-**fasttext/get_fasttext_embeddings.bash**: script that downloads the set of word vectors computed with the FastText used.
-**gloVe/**
-**gloVe/**
-**2word2vec.py**: Transform the GloVe vector set to Word2Vec format.
-**2word2vec.py**: transforms the GloVe vector set to Word2Vec format.
-**get_glove_embeddings.bash**: * script *that downloads the GloVe computed word vector set used.
-**get_glove_embeddings.bash**: script that downloads the GloVe word embeddings set used.
-**word2vec/get_word2vec_embeddings.bash**: * script *that downloads the set of word vectors computed with the Word2Vec used.
-**word2vec/get_word2vec_embeddings.bash**: script that downloads the Word2Vec word embeddings set used.
-**frequencies.tsv**
-**frequencies.tsv**
-**.gitignore**
-**.gitignore**
-**LICENSE**
-**LICENSE**
-**SENTEVAL_LICENSE**: license of the [SentEval](https://github.com/facebookresearch/SentEval) toolkit developed by Facebook.
-**SENTEVAL_LICENSE**: license of the [SentEval](https://github.com/facebookresearch/SentEval) toolkit developed by Facebook.
-**evaluation.ipynb**: Jupyter Notebook file in which the evaluation carried out is developed.
-**evaluation.ipynb**: Jupyter Notebook file in which the evaluation carried out is developed.
-**load.py**: Contains a set of functions to load and preprocess the different data sets used. The code is based on what can be found in the [SentEval] toolkit (https://github.com/facebookresearch/SentEval).
-**methods.py**: Contains the functions that implement the three evaluated methods to calculate the semantic similarity between two pairs of sentences: average (average), * Smooth Inverse Frequency * (SIF), and * Word Mover's distance *.
-**load.py**: contains a set of functions to load and preprocess the different data sets used. The code is based on what can be found in the [SentEval](https://github.com/facebookresearch/SentEval) toolkit .
-**utils.py**: Contains some utility functions to preprocess sentences and evaluate the results of the different methods.
-**methods.py**: contains the functions that implement the three evaluated methods to calculate the semantic similarity between two pairs of sentences: average, Smooth Inverse Frequency(SIF), and Word Mover's distance.
-**utils.py**: contains some utility functions to preprocess sentences and evaluate the results of the different methods.