Post navigation

Modèle question de corpus

Le jeu de données SciQ contient 13 679 questions d`examen de science participative sur la physique, la chimie et la biologie, entre autres. Les questions sont dans un format à choix multiple avec 4 options de réponse chacune. Pour la majorité des questions, un paragraphe additionnel contenant des éléments de preuve à l`appui de la bonne réponse est fourni. Avoir une autre question concernant 1) Classification de texte, 2ème lien: IMDB Movie Review sentiment classification: utilisation keras API IMDB. load_data: Comment regardons-nous le vocabulaire construit par keras IMDB API? Si cette analyse IMDB est un jeu de données volumineux, est-il possible que le vocabulaire construit peut être utilisé pour d`autres problèmes de classification des sentiments, pas spécifique à cette revue de film seulement? (cela signifie, nous avons un grand corpus, nous pouvons l`utiliser pour faire un classificateur de sentiment d`usage général). Ces questions ont été créées à l`aide de l`ensemble de données «AI2 Elementary School Science questions (no Diagrams)» en changeant toutes les options de réponse incorrectes de chaque question avec un autre mot connexe. Ce jeu de données peut être une bonne mesure de robustesse pour les systèmes d`AQ lorsqu`ils sont testés sur des questions modifiées. Plus de détails peuvent être trouvés dans le document réponse de question par l`intermédiaire de la programmation d`entier sur la connaissance semi-structurée. Désolé, je ne comprends pas votre question, pouvez-vous la reformuler? La réponse à une question est une tâche où une phrase ou un échantillon de texte est fourni à partir duquel les questions sont posées et doivent être répondues. OpenBookQA vise à promouvoir la recherche dans les questions-réponses avancées, en sondant une compréhension plus approfondie du sujet (avec des faits saillants résumées comme un livre ouvert, également fourni avec le jeu de données) et la langue dans laquelle il est exprimé. En particulier, il contient des questions qui nécessitent un raisonnement à plusieurs étapes, l`utilisation de connaissances communes et de sens commun supplémentaires, et la compréhension du texte riche. Ce paquet contient une copie de l`Aristo Tablestore (nov.

2015 snapshot), ainsi qu`un large éventail de questions à choix multiple de foule couvrant les faits dans les tableaux. Grâce à la configuration de la tâche d`annotation provenant de la foule, le package contient également des informations d`alignement implicites entre les questions et les tables. Pour plus d`informations, consultez «TabMCQ: un jeu de données de tables de connaissances générales et de questions à choix multiple» (PDF inclus dans ce paquet). Ce jeu de données a été produit par AI2 et Sujay Kumar Jauhar (Université Carnegie Mellon). Une collection de ressources pour étudier l`inférence centrée sur l`explication, y compris des graphiques d`explication pour 1 680 questions, avec 4 950 rangées de tables, et d`autres analyses des connaissances requises pour répondre aux questions de science élémentaire et du milieu-école. L`Explationbank a été construit par Peter Jansen (Université de l`Arizona), en collaboration avec AI2. C`est le jeu de données pour le papier qu`est-ce qu`une explication? Caractérisation des connaissances et des exigences d`inférence pour les examens des sciences élémentaires (COLING` 16). Les données contiennent: des phrases d`explication en or supportant 363 questions scientifiques, des annotations de relation pour un sous-ensemble de ces explications et un outil d`annotation graphique avec des directives d`annotation.

This entry was posted in Uncategorized by admin. Bookmark the permalink.