目前我抽数据随机测了一下你的这个模型和[princeton-nlp](https://huggingface.co/princeton-nlp/sup-simcse-roberta-large)的结果,发现在英文数据中princeton-nlp的模型更好一点,中文的数据你的这个更好一些。请问你这边对文档的embeding是更倾向中文的么?