Wikilingua Cross Lingual #809

Muennighoff · 2022-07-28T08:41:31Z

This is a bit hacky, maybe you don't want it

from promptsource.templates import DatasetTemplates
from functools import partial
import multiprocessing
import os
import datasets
from datasets import load_dataset
from functools import partial

ds_name, subset_name = "GEM/wiki_lingua", "fr_zh"


def add_code(example):
    example["source_language_name"] = "French"
    example["target_language_name"] = "Chinese"
    return example

def filter_a_b(example, lang_a, lang_b):
    return example["source_language"] == lang_a and example["target_language"] == lang_b

ds = load_dataset(ds_name, subset_name, split="train")
ds = ds.map(add_code)
ds = ds.filter(partial(filter_a_b, lang_a=subset_name.split("_")[0], lang_b=subset_name.split("_")[1]))

prompts = DatasetTemplates(f"{ds_name}/en_en")
for t_name in prompts.all_template_names:
    print(prompts[t_name].apply(ds[1]))

Eval hackathon

Muennighoff added 4 commits July 19, 2022 11:02

Merge pull request #4 from bigscience-workshop/eval-hackathon

619daa1

Eval hackathon

Add en_en v01

960a71e

Add instructions

cdb9908

Add name

97df53b

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Wikilingua Cross Lingual #809

Wikilingua Cross Lingual #809

Uh oh!

Muennighoff commented Jul 28, 2022

Uh oh!

Uh oh!

Wikilingua Cross Lingual #809

Are you sure you want to change the base?

Wikilingua Cross Lingual #809

Uh oh!

Conversation

Muennighoff commented Jul 28, 2022

Uh oh!

Uh oh!