Skip to content

Conversation

@ilyaonoff
Copy link
Collaborator

@ilyaonoff ilyaonoff commented Apr 27, 2024

В первом варианте, с просто расхардкоженными параметрами калибровки при квантизации получилось вот так. Существующий код постарался оставить работающим, добавил новые параметры, но из-за этого в некоторых местах появилось дублирование параметров в конфиге и вне.

Пример конфига:

{
    "dataset": "path/to/dataset.jsonl",
    "batch_size": 1,
    "max_samples": 32,
    "max_seq_length": 2048,
    "formatting_func": {
        "template": [
            {
                "type": "from_sample",
                "key": "query"
            },
            {
                "type": "text",
                "text": "...." # FILL some separator
            },
            {
                "type": "from_sample",
                "key": "reply"
            }
        ],
        "replacement_rules": { }
    },
    "truncation": false
}

@ilyaonoff ilyaonoff force-pushed the ngram_penalty_v0.9.0 branch from ba32c00 to d2e7d93 Compare June 5, 2024 13:50
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant