bhavnicksm chonkie issues

bhavnicksm / chonkie

🦛 CHONK your texts with Chonkie ✨ - The no-nonsense RAG chunking library

https://pypi.org/project/chonkie/

MIT License

980 stars 29 forks source link

issues

Newest

Newest Most commented Recently updated Oldest Least commented Least recently updated

ImportError: cannot import name 'tokenizer' from 'tokenizers' (/usr/local/lib/python3.10/site-packages/tokenizers/__init__.py)

#25 abchbx opened 2 hours ago
0
fix: tokenizer mismatch for `SemanticChunker` + Add BaseEmbeddings

#24 bhavnicksm closed 5 hours ago
0
Can I load offline tokenizers in it?

#23 a136214808 opened 1 day ago
2
Update README.md + minor updates

#22 bhavnicksm closed 1 day ago
0
Remove Spacy dependency from 'sentence' install + Add FAQ to DOCS.md

#21 bhavnicksm closed 1 day ago
0
Remove Spacy dependency from Chonkie

#20 bhavnicksm closed 1 day ago
0
Add FastEmbed Support for Embedding Generation/Inference

#19 adithya-s-k opened 2 days ago
4
`TokenChunker` does not support multiple inputs

#18 not-lain opened 2 days ago
3
Update README.md + fix DOCS.md typo

#17 bhavnicksm closed 2 days ago
0
Incorrect import in Docs, SDPMChunker reference

#16 Om-Alve closed 2 days ago
1
Update acknowledgements in README.md for improved clarity and appreci…

#15 bhavnicksm closed 4 days ago
0
Development

#14 bhavnicksm closed 4 days ago
0
Run Black + Isort + beautify the code a bit

#13 bhavnicksm closed 4 days ago
0
Make imports as a part of Chunker __init__ instead of file imports to make Chonkie import faster

#12 bhavnicksm closed 4 days ago
0
Bump version to 0.1.1 in pyproject.toml and __init__.py

#11 bhavnicksm closed 5 days ago
0
Update README.md

#10 bhavnicksm closed 5 days ago
0
Disentangle the Embedding Model from SemanticChunker + Update DOCS and README

#9 bhavnicksm closed 5 days ago
0
Bump version to 0.0.3 in pyproject.toml and __init__.py for release

#8 bhavnicksm closed 6 days ago
0
Update README.md + remove .github action

#7 bhavnicksm closed 6 days ago
0
Bump version to 0.0.2 in pyproject.toml and __init__.py for release

#6 bhavnicksm closed 6 days ago
0
Update README.md

#5 bhavnicksm closed 6 days ago
0
Add support for Transformers and TikToken

#4 bhavnicksm closed 6 days ago
0
v0.0.1a8

#3 bhavnicksm closed 1 week ago
0
Update Logo (for PyPI) + Update README.md + Fix packaging bug

#2 bhavnicksm closed 1 week ago
0
v0.0.1a4

#1 bhavnicksm closed 1 week ago
0

bhavnicksm / chonkie

issues

ImportError: cannot import name 'tokenizer' from 'tokenizers' (/usr/local/lib/python3.10/site-packages/tokenizers/init.py)

fix: tokenizer mismatch for `SemanticChunker` + Add BaseEmbeddings

Can I load offline tokenizers in it?

Update README.md + minor updates

Remove Spacy dependency from 'sentence' install + Add FAQ to DOCS.md

Remove Spacy dependency from Chonkie

Add FastEmbed Support for Embedding Generation/Inference

`TokenChunker` does not support multiple inputs

Update README.md + fix DOCS.md typo

Incorrect import in Docs, SDPMChunker reference

Update acknowledgements in README.md for improved clarity and appreci…

Development

Run Black + Isort + beautify the code a bit

Make imports as a part of Chunker init instead of file imports to make Chonkie import faster

Bump version to 0.1.1 in pyproject.toml and init.py

Update README.md

Disentangle the Embedding Model from SemanticChunker + Update DOCS and README

Bump version to 0.0.3 in pyproject.toml and init.py for release

Update README.md + remove .github action

Bump version to 0.0.2 in pyproject.toml and init.py for release

Update README.md

Add support for Transformers and TikToken

v0.0.1a8

Update Logo (for PyPI) + Update README.md + Fix packaging bug

v0.0.1a4