public class TextSplitter extends Object
| Constructor and Description |
|---|
TextSplitter() |
| Modifier and Type | Method and Description |
|---|---|
static List<String> |
splitByChars(String doc,
String separatorChars)
将输入的文本进行切割
|
static List<String> |
splitByChars(String doc,
String separatorChars,
int maxChunkSize)
将输入的文本进行切割
|
static List<String> |
splitByChars(String doc,
String separatorChars,
int maxChunkSize,
int chunkOverlap)
将输入的文本按照1个或多个字符进行切割
|
static List<String> |
splitByString(String doc,
String separator)
将输入的文本按照一个字符串进行切割
|
static List<String> |
splitByString(String doc,
String separator,
int maxChunkSize)
将输入的文本按照一个字符串进行切割
|
static List<String> |
splitByString(String doc,
String separator,
int maxChunkSize,
int chunkOverlap)
将输入的文本按照一个字符串进行切割
|
public static List<String> splitByChars(String doc, String separatorChars, int maxChunkSize, int chunkOverlap)
doc - 输入的文本separatorChars - 切割使用的分隔符,支持按多个字符分割,例如",;"表示按照","或";"分割maxChunkSize - 每个切割后的文本的大小(字符数量),0表示使用最小切割长度chunkOverlap - 每个切割后的文本重叠长度,0表示不重叠public static List<String> splitByString(String doc, String separator, int maxChunkSize, int chunkOverlap)
doc - 输入的文本separator - 切割使用的字符串maxChunkSize - 每个切割后的文本的大小(字符数量),0表示使用最小切割长度chunkOverlap - 每个切割后的文本重叠长度,0表示不重叠public static List<String> splitByChars(String doc, String separatorChars, int maxChunkSize)
doc - 输入的文本separatorChars - 切割使用的分隔符maxChunkSize - 每个切割后的文本的大小(字符数量),0表示使用最小切割长度public static List<String> splitByChars(String doc, String separatorChars)
doc - 输入的文本separatorChars - 切割使用的分隔符public static List<String> splitByString(String doc, String separator, int maxChunkSize)
doc - 输入的文本separator - 切割使用的字符串maxChunkSize - 每个切割后的文本的大小(字符数量),0表示使用最小切割长度Copyright © 2024. All rights reserved.